PHP爬蟲庫:Page Scraper

jopen 10年前發布 | 16K 次閱讀 網絡爬蟲 Page Scraper

易于使用的Web頁面數據提取PHP類庫,只需要幾行代碼。使用XPath 或 CSS Selector可以從任意網站抓取數據。示例:

$page = new Page('https://news.ycombinator.com');
$builder = new PageBuilder($page);
$builder->setDataConfig(array(
    'side_links' => array('css' => '.title .comhead'), // use CSS Selector
    'titles'     => '//td[@class="title"]//a/text()', // use XPath
    'links'      => '//td[@class="title"]//a/@href', // use XPath
));
$director = new PageBuilderDirector($builder);
$director->buildPage();
$data = $page->getData();

項目主頁:http://www.baiduhome.net/lib/view/home/1418132786573

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!