Java搜索引擎平臺 Hawk
Hawk 搜索引擎平臺 是面向中小型網站,可以定制的垂直搜索引擎平臺。本搜索引擎平臺目標是方便用戶搭建站內搜索、某個領域的垂直搜索、以及檢索個人文檔以及自己關注的網站信 息的桌面搜索等應用領域。它改造自Lucene,Hadoop和Nutch系統,是純Java的搜索平臺軟件,可以運行于Windows及Linux等平 臺,具備基本的抓取、索引和檢索功能,本搜索引擎免費下載,歡迎大家測試和使用!
- 對網頁進行深度抓取和分析,自定義抓取規則,實現站內搜索。
- 可以索引各種常用類型文檔,實現桌面文檔檢索。
- 單臺PC服務器能索引上千萬文檔,可以用于中小型檢索服務。
- 可以自定義網頁展示模板,或XML接口,輕松與各種系統整合。
- 自動分析網頁文本,提取新詞,如人名,地名等。
- 支持檢索詞自動推薦以及繁簡轉換功能。
- 可以定制主頁的各項文字,包括包含自己的歡迎網頁。
示例應用:Hawk搜索引擎平臺應用:詞典搜索、開發文檔庫搜索
項目主頁:http://www.baiduhome.net/lib/view/home/1325428618437
本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!