Goose是一個能夠抽取網頁中文章正文的Java開源項目。它能夠對一個給定的網頁進行計算并提取文章的主要內容和該頁面中哪一張是最重要的圖片。

<DIV class=date>收錄時間:2011-01-11 20:28:27</DIV>

 本文由用戶 碼頭工人自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!