Java Web爬蟲 - ItSucks

jopen 12年前發布 | 44K 次閱讀 爬蟲 網絡爬蟲

stormy.png
ItSucks是一個Java Web爬蟲開源項目。可靈活定制,支持通過下載模板和正則表達式來定義下載規則。提供一個控制臺和Swing GUI操作界面。

功能特性:
  • 多線程
  • 正則表達式
  • 保存/載入的下載工作
  • 在線幫助
  • HTTP/HTTPS 支持
  • HTTP 代理 支持
  •  HTTP身份驗證
  • Cookie 支持
  • 可配置的User Agent
  •  連接限制
  • 配置HTTP響應代碼的行為
  • 帶寬限制
  • Gzip壓縮

Java Web爬蟲 - ItSucks

Java Web爬蟲 - ItSucks

項目主頁:http://www.baiduhome.net/lib/view/home/1350028633541

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!