Java 全文搜索引擎,Apache Lucene 5.4.0 發布

bwnx 8年前發布 | 9K 次閱讀 Apache Lucene

Apache Lucene? 5.4.0 發布,此版本包括大量的 bug 修復,優化和改進,現已提供下載:

http://lucene.apache.org/core/mirrors-core-latest-redir.html 

更新說明:https://lucene.apache.org/core/5_4_0/changes/Changes.html 

Lucene 5.4.0 值得關注的改進:

API 改進
 * Query.getBoost and Query.setBoost are deprecated in favour of the
   new BoostQuery
 * The Filter class is deprecated in favour of FILTER clauses in a
   BooleanQuery
 * DefaultSimilarity has been renamed to ClassicSimilarity to
   prepare for the move to BM25 in Lucene 6

新特性
 * New Serbian token filter
 * New DecimalDigitFilter, to fold unicode digits to latin digits
 * New UnicodeWhitespaceTokenizer, that uses Unicode's whitespace
   definition and splits on NBSP
 * New GeoPointDistanceRangeQuery to search for geo-points within
   a ring
 * Query caching is now enabled by default in IndexSearcher, use
   IndexSearcher.setQueryCache(null) to disable

優化
 * MatchAllDocsQuery got faster
 * Doc values now use less memory for multi-valued fields and
   less disk in case of sparse fields
 * Two-phase iterators got a match cost API so that the costly
   bits can be checked last

Bug 修復
 * PatternTokenizer no longer hangs onto heap sized to the maximum input
   string it's ever seen.

Lucene 是apache軟件基金會一個開放源代碼的全文檢索引擎工具包,是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎。 Lucene的目的是為軟件開發人員提供一個簡單易用的工具包,以方便的在目標系統中實現全文檢索的功能,或者是以此為基礎建立起完整的全文檢索引擎。

Lucene 最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構的研究。他貢獻出Lucene的目標是為各種中小型應用程式加入全文檢索功能。



來自:http://www.oschina.net/news/68996/lucene-5-4-0

 本文由用戶 bwnx 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!