PHP爬蟲庫：Page Scraper

jopen 11年前發布 | 16K 次閱讀網絡爬蟲 Page Scraper

易于使用的Web頁面數據提取PHP類庫，只需要幾行代碼。使用XPath 或 CSS Selector可以從任意網站抓取數據。示例：

$page = new Page('https://news.ycombinator.com');
$builder = new PageBuilder($page);
$builder->setDataConfig(array(
    'side_links' => array('css' => '.title .comhead'), // use CSS Selector
    'titles'     => '//td[@class="title"]//a/text()', // use XPath
    'links'      => '//td[@class="title"]//a/@href', // use XPath
));
$director = new PageBuilderDirector($builder);
$director->buildPage();
$data = $page->getData();

項目主頁：http://www.baiduhome.net/lib/view/home/1418132786573

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1418132786573.html

網絡爬蟲 Page Scraper

PHP爬蟲庫：Page Scraper

相關經驗

相關資訊

相關文檔

目錄