輕量化易用網絡爬蟲Gecco v1.1.3 發布

jopen 8年前發布 | 10K 次閱讀 Gecco 爬蟲 Java

Gecco是一款用java語言開發的輕量化的易用的網絡爬蟲。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等優秀框架,讓您只需要配置一些jquery風格的選擇器就能很快的寫出一個爬蟲。Gecco框架有優秀的可擴展性,框架基于開閉原則進行設計,對修改關閉、對擴展開放。同時Gecco基于十分開放的MIT開源協議。

更新日志

1.處理jsonp的時候分號的問題修復
2.支持自定義下載重試次數定義,GeccoEngine.retry(count)
3.HttpClientDownloader支持response的Set Cookie自動存儲
4.修改以支持JSON的JsonBean遞歸解析 by shangjian

下載

 

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!