基于Solr搜索服務器的全文檢索

jopen 11年前發布 | 28K 次閱讀 Solr 搜索引擎

1:何為全文檢索

全 文檢索是一種將文件中所有文本與檢索關鍵詞匹配的文字資料檢索方法,比如我們將一本書的作者、出版日期、出版社、章節、章節內容都存于數據庫中,那么我們 輸入任何一個詞,可以將該書中任意與該此匹配的信息檢索出來,我們輸入“張三”,可能我們找到的是作者張三,也可能是某章節的一段內容中含有張三。我們在 日常生活中用的最多的全文檢索莫過于使用Windows的搜素功能,不信?沒注意?現在來試試吧!

2:什么是solr

solr是基于Lucene內核的一種搜素服務器,我們都知道Lucene是用來做索引的,solr在Lucene基礎上做了很多封裝和優化。我們在solr上可以隨時配置、擴展我們data schema,自由決定我們的field的存儲和索引,配置我們的分詞策略,查詢我們需要的數據格式。我們來看看solr的架構吧:

基于Solr搜索服務器的全文檢索

Solr4.x還有一套非常燒包的UI管理界面,如下:

基于Solr搜索服務器的全文檢索

3:solr能干些什么

基于任何字段進行分詞檢索;

數據分頁;

基于任何字段進行統計;

關鍵詞高亮;

分布式計算和存儲;(4.x以上)

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!