輕量化易用網絡爬蟲Gecco v1.2.2 發布

jopen 8年前發布 | 11K 次閱讀 Gecco 爬蟲 Java

Gecco是一款用java語言開發的輕量化的易用的網絡爬蟲。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等優秀框架,讓您只需要配置一些jquery風格的選擇器就能很快的寫出一個爬蟲。Gecco框架有優秀的可擴展性,框架基于開閉原則進行設計,對修改關閉、對擴展開放。同時Gecco基于十分開放的MIT開源協議。

更新日志

  1. 修復UniqueSpiderScheduler的排序錯誤
  2. DynamicGecco穩定版,支持動態改變抓取規則
  3. JsonPipeline,提供運行時生產SpiderBean時使用
  4. 支持tomcat等非雙親委派模型的ClassLoader

下載

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!