OpenWebSpider - 開源多線程Web爬蟲

jopen 12年前發布 | 41K 次閱讀 爬蟲 網絡爬蟲

OpenWebSpider是一個開源多線程Web爬蟲和包含許多有趣功能的搜索引擎。

OpenWebSpider的使用方法。
一般情況下我們通過在CMD下輸入
openwebspider -i www.**.com -e -s
就可以對你指定的網站進行采集了。

參數說明:
-I 在數據庫里搜索字符串。        eg: openwebspider -I '美女'
-O 指定數據庫內主機進行索引      eg: openwebspider -O 'www.baidu.com'
-i 指定主機名                    eg: openwebspider -i www.baidu.com
-t 線程 如不設定,默認為20
-s 限制層數 默認為0 不限制
-l 限制索引頁數量 默認為0 不限制
-c 限制每頁索引花費時間。
-b 限制出錯時間
-e 限定主機,(不添加外部主機)
-F 自由索引模式
OpenWebSpider - 開源多線程Web爬蟲 OpenWebSpider - 開源多線程Web爬蟲

項目主頁:http://www.baiduhome.net/lib/view/home/1350115826550

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!