輕量化易用網絡爬蟲Gecco v1.2.0 發布
Gecco是一款用java語言開發的輕量化的易用的網絡爬蟲。Gecco整合了jsoup、httpclient、fastjson、spring、htmlunit、redission等優秀框架,讓您只需要配置一些jquery風格的選擇器就能很快的寫出一個爬蟲。Gecco框架有優秀的可擴展性,框架基于開閉原則進行設計,對修改關閉、對擴展開放。同時Gecco基于十分開放的MIT開源協議。
更新日志
1、HttpClientDownloader保證inputstream能重復使用,@shangjian提供修改思路
2、支持一個Before/AfterDownloader對應多個SpiderBean
3、Gecco的動態編程是新版本的核心功能,Gecco支持動態生成SpiderBean包括類,屬性,注解。可以不需要預先定義SpiderBean即可完成抓取。
下載
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!