8 個基于 Lucene 的開源搜索引擎

fmms 12年前發布 | 17K 次閱讀 Lucene

Lucene是一種功能強大且被廣泛使用的搜索引擎,以下列出8種基于Lucene的搜索引擎,你可以想象他們有多么強大...

Apache Solr
Solr是一個高性能,采用Java5開發,基于Lucene的全文搜索服務器。文檔通過Http利用XML加到一個搜索集合中。查詢該集合也是通過 http收到一個XML/JSON響應來實現。它的主要特性包括:高效、靈活的緩存功能,垂直搜索功能,高亮顯示搜索結果,通過索引復制來提高可用性,提 供一套強大Data Schema來定義字段,類型和設置文本分析,提供基于Web的管理界面等。http://lucene.apache.org/solr/ 

Elastic Search
ElasticSearch是一個基于Lucene構建的開源,分布式,RESTful搜索引擎。設計用于云計算中,能夠達到實時搜索,穩定,可靠,快速,安裝使用方便。支持通過HTTP使用JSON進行數據索引。http://www.elasticsearch.com

Index Tank
IndexTank, 一套基于Java的索引-實時全文搜索引擎實現,Includes features like variables (boosts), categories (facets), faceted search, snippeting, custom scoring functions, suggest, and autocomplete。IndexTank的設計分離了相關性標記和文檔內容,因為相關性標記的生命周期和文檔本身是不一樣的,特別是在用戶創建的內容的情況下,例如 分享次數,Like按鈕,+1按鈕等等。https://github.com/linkedin/indextank-engine

Katta

Katta是一個可擴展的、故障容錯的、分布式實施訪問的數據存儲。

Katta可用于大量、重復、索引的碎片,以滿足高負荷和巨大的數據集。這些索引可以是不同的類型。當前該實現在LuceneHadoop mapfiles

 http://katta.sourceforge.net/ 

Bobo Search 

bobo-browse 是一用java寫的lucene擴展組件,通過它可以很方便在lucene上實現分組統計功能。

比如說搜索電腦,可以得到cpu是intel的有幾條命中記錄,cpu是amd的有幾條命中記錄。

 https://github.com/javasoze/bobo 

Compass

Compass是一個強大的,事務的,高性能的對象/搜索引擎映射(OSEM:object/search engine mapping)與一個Java持久層框架.Compass包括:  

* 搜索引擎抽象層(使用Lucene搜索引薦),
 * OSEM (Object/Search Engine Mapping) 支持,
 * 事務管理,
 * 類似于Google的簡單關鍵字查詢語言, 
 * 可擴展與模塊化的框架,
 * 簡單的API.

 http://www.compass-project.org/ 

Summa

Summa是一種由java開發的,快速模塊化和可擴展的搜索引擎. Summa 有如下特點:

  • 綜合搜索. Summa 能夠同時訪問許多不同的數據和資料來源,并以一個統一的接口公開

  • 模塊化設計.Summa 搜索系統由一系列獨立模塊組成, 這樣使得它更簡單容易地被維護和升級

  • 可擴展性. Summa 支持分布式架構而且能夠按比例的擴大或縮小以處理任何數量的數據

  • 開放標準. Summa 基于現代web技術與標準, 不包含任何私有代碼或原理.

  • 故障容錯. 如果某單一數據資源或服務出錯, Summa 將會繼續運行而不受出錯部分限制.

http://wiki.statsbiblioteket.dk/summa/ 

Constellio
Constellio 是一個開源的搜索解決方案,適合企業級的搜索。基于 Apache Solr 項目構建,使用 Lucene 做為搜索引擎,并提供基于 Web 的網頁和文檔的檢索。可選擇文檔類型、文件夾以及文件名進行檢索。http://constellio.com/

via findbestopensource

 本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!