Java 全文本搜索引擎 Egothor
Egothor是一個用Java編寫的開源而高效的全文本搜索引擎。借助Java的跨平臺特性,Egothor能應用于任何環境的應用,既可配置為單獨的搜索引擎,又能用于你的應用作為全文檢索之用。
主要特性
- 采用Java開發,實現跨平臺支持
- 快速索引更新的新dynamization算法
- 支持64-bit 內核
- 支持事務(ACID)
- 增量更新
- 查詢可以在并行的方式解決
- 能夠識別大部分相似的文件:HTML, PDF, PS, and Microsoft's DOC, and XLS.
- 高容量的機器人,它支持的robots.txt建議。
- 使用最好的壓縮方法,如:Golomb, Elias-Gamma, Block coding.
- 基于擴展布爾模型可以作為矢量或布爾模型。
- 通用詞干可以處理任何語言。
本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!