輕量化易用網絡爬蟲Gecco v1.2.4 發布
Gecco是一款用java語言開發的輕量化的易用的網絡爬蟲。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等優秀框架,讓您只需要配置一些jquery風格的選擇器就能很快的寫出一個爬蟲。Gecco框架有優秀的可擴展性,框架基于開閉原則進行設計,對修改關閉、對擴展開放。同時Gecco基于十分開放的MIT開源協議。
更新日志
- 修復GeccoEngine生命周期EventListener,onStart無效的bug
- 修改圖片自動下載方式,對@Image提供單獨的渲染器ImageFieldRender
- 修復大規模爬取時有時httpclient阻塞的bug
- 優化異常處理,RenderException將不會中斷渲染和pipeline處理,而是記錄日志
- 升級guava到最新的19.0版本
下載
本站原創,轉載時保留以下信息:
本文轉自:深度開源(open-open.com)
原文地址:http://www.baiduhome.net/news/view/51ed745
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!