Apache Lucene 4.0 Beta 發布
Lucene是一套用于全文檢索Java開源框架, 由Apache軟件基金會支持和提供。Lucene提供了一個簡單確強大的應用程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個 成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索程式庫,就像是 搜尋引擎,但是不應該將資訊檢索程式庫與網搜索引擎相混淆。
Lucene最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構的研究。他貢獻出Lucene的目標是為各種中小型應用程式加入全文檢索功能。
Apache Lucene 4.0 發布 Beta 版,該版本包含大量的 bug 修復、優化和提升,值得關注的有:
* IndexWriter.tryDeleteDocument 可根據文檔 id 來刪除,用于某些應用提升性能
* 新的 BloomFilteringPostingsFormat 和 DirectPostingsFormat
* CJK 分析的提升
* 改進評分器導航 API (Scorer.getChildren) 支持所有查詢,用于檢測查詢匹配部分
* 分析器的改進,提供工廠類用于創建 Tokenizer, TokenFilter 和 CharFilter 從 Solr 移出到 Lucene 的分析模塊,降低 StandardTokenizer 和 Snowball 過濾器的內存開銷
* 改進對多值域的高亮
* 一些 API 的更改、優化和 bug 修復
更詳細說明請下載后查看 CHANGES.txt 文件,以及 MIGRATE.txt 文件告訴你如何升級到這個版本。
更詳細內容請看官方發行說明。