Go 爬蟲軟件,Pholcus 0.5.2 發布
Pholcus(幽靈蛛)是一款純Go語言編寫的重量級爬蟲軟件,清新的GUI界面,優雅的爬蟲規則、可控的高并發、任意的批量任務、多種輸出方式、大量Demo,支持橫縱向兩種抓取模式,支持模擬登錄和任務取消等,并且考慮了支持分布式布局。
框架模塊
框架特點
-
Pholcus(幽靈蛛)以高效率,高靈活性和人性化設計為開發的指導思想;
</li> -
繼承Go語言“少即是多”的風格,GUI界面盡量少得呈現技術層面的參數配置,而在程序內部做智能化參數調控;
</li> -
對采集規則進行了精心設計,結構化規則、高度封裝、通用方法集、自由靈活的發揮空間,讓你輕松添加規則;
</li> -
每個pholcus程序既可以是服務器也可以是客戶端,通過socket傳遞request來實現任務分發,其中hpolcus模塊充當管理核心的角色, 負責分發給其他節點和本地隊列請求以及實時log,比如,讓Pholcus軟件同時在10臺電腦運行,你就擁有了10個節點,自然形成分布式。
</li> -
支持橫縱向兩種抓取模式,并支持任務取消操作。
</li> </ol> Pholcus 0.5.2 發布,更新內容如下: