Apache Lucene 4.0 Beta 發布

openkk 12年前發布 | 8K 次閱讀 Lucene

Lucene是一套用于全文檢索Java開源框架, 由Apache軟件基金會支持和提供。Lucene提供了一個簡單確強大的應用程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個 成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索程式庫,就像是 搜尋引擎,但是不應該將資訊檢索程式庫與網搜索引擎相混淆。

Lucene最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構的研究。他貢獻出Lucene的目標是為各種中小型應用程式加入全文檢索功能。


Apache Lucene 4.0 發布 Beta 版,該版本包含大量的 bug 修復、優化和提升,值得關注的有:

* IndexWriter.tryDeleteDocument 可根據文檔 id 來刪除,用于某些應用提升性能
* 新的 BloomFilteringPostingsFormat 和 DirectPostingsFormat
* CJK 分析的提升
* 改進評分器導航 API (Scorer.getChildren) 支持所有查詢,用于檢測查詢匹配部分
* 分析器的改進,提供工廠類用于創建 Tokenizer, TokenFilter 和 CharFilter 從 Solr 移出到 Lucene 的分析模塊,降低 StandardTokenizer 和 Snowball 過濾器的內存開銷
* 改進對多值域的高亮
* 一些 API 的更改、優化和 bug 修復

更詳細說明請下載后查看 CHANGES.txt 文件,以及 MIGRATE.txt 文件告訴你如何升級到這個版本。

更詳細內容請看官方發行說明

 本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!