Crawler是一個簡單的Web爬蟲。它讓你不用編寫枯燥,容易出錯的代碼,而只專注于所需要抓取網站的結構。此外它還非常易于使用。

<DIV class=java><CODE class=java><FONT face=NSimsun><SPAN class=java10>CrawlerConfiguration cfg = </SPAN><SPAN class=java4>new </SPAN><SPAN class=java10>CrawlerConfiguration</SPAN><SPAN class=java8>(</SPAN><SPAN class=java5>"http://www.baiduhome.net"</SPAN><SPAN class=java8>)</SPAN></FONT><FONT face=NSimsun><SPAN class=java10>;
PageCrawler crawler = </SPAN><SPAN class=java4>new </SPAN><SPAN class=java10>PageCrawler</SPAN><SPAN class=java8>(</SPAN><SPAN class=java10>cfg</SPAN><SPAN class=java8>)</SPAN></FONT><FONT face=NSimsun><SPAN class=java10>;
crawler.crawl</SPAN><SPAN class=java8>(</SPAN><SPAN class=java4>new </SPAN><SPAN class=java10>YourPageVisitor</SPAN><SPAN class=java8>())</SPAN><SPAN class=java10>;
</SPAN></FONT></CODE>

<DIV class=date>收錄時間:2011-03-05 09:41:09</DIV></DIV>

 本文由用戶 碼頭工人自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!