Java 全文本搜索引擎 Egothor

fmms 12年前發布 | 46K 次閱讀 Java 搜索引擎

Egothor是一個用Java編寫的開源而高效的全文本搜索引擎。借助Java的跨平臺特性,Egothor能應用于任何環境的應用,既可配置為單獨的搜索引擎,又能用于你的應用作為全文檢索之用。

主要特性

  • 采用Java開發,實現跨平臺支持
  • 快速索引更新的新dynamization算法
  • 支持64-bit 內核
  • 支持事務(ACID)
  • 增量更新
  • 查詢可以在并行的方式解決
  • 能夠識別大部分相似的文件:HTML, PDF, PS, and Microsoft's DOC, and XLS.
  • 高容量的機器人,它支持的robots.txt建議。
  • 使用最好的壓縮方法,如:Golomb, Elias-Gamma, Block coding.
  • 基于擴展布爾模型可以作為矢量或布爾模型。
  • 通用詞干可以處理任何語言。

項目主頁:http://www.baiduhome.net/lib/view/home/1325429725421

 本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!