目錄企業搜索引擎方案選型Solr的特性介紹Solr的安裝與配置Solr的應用過程Solr的測試數據一企業搜索引擎方案選型由于搜索引擎功能在門戶社區中對提高用戶體驗有著重要作用,在門戶社區中涉及大量需要搜索引擎的功能需求,目前在實現搜索引擎的方案上有集中方案可供選擇:基于Lucene自己進行封裝實現站內搜索。工作量及擴展性都較大,不采用。調用Google、Baidu的API實現站內搜索。
???由于搜索引擎功能在門戶社區中對提高用戶體驗有著重在門戶社區中涉及大量需要搜索引擎的功能需求,目前在實現搜索引擎的方案上有集中方案可供選擇:基于Lucene自己進行封裝實現站內搜索。工作量及擴展性都較大,不采用。調用Google、Baidu的API實現站內搜索同第三方搜索引擎綁定太死,無法滿足后期業務擴展需要,暫時不采用。基于Compass+Lucene實現站內搜索???適合于對數據庫驅動的應用數據進行索引,尤其是替代傳統的like‘%expression%’來實現對varchar或clob等字段的索引,對于實現站內搜索是一種值得采納的方案。
本文主要介紹solr中facet的基本應用。Facet是solr的高級搜索功能之一,可以給用戶提供更友好的搜索體驗.在搜索關鍵字的同時,能夠按照Facet的字段進行分組并統計.
Solr 最初由 CNET Networks 開發,2006 年初,Apache Software Foundation 在 Lucene 頂級項目的支持下得到了 Solr。Solr 于 2007 年 1 月醞釀成熟,在整個項目孵化期間,Solr 穩步地積累各種特性并吸引了一個穩定的用戶群體、貢獻者和提交人。Solr 現在是 Lucene(Apache 的基于 Java 的全文本搜索引擎庫)的一個子項目。
Solr 是一種開放源碼的、基于 Lucene Java 的搜索服務器,易于加入到 Web 應用程序中。Solr 提供了層面搜索、命中醒目顯示并且支持多種輸出格式(包括 XML/XSLT 和 JSON 格式)。它易于安裝和配置,而且附帶了一個基于 HTTP 的管理界面。您可以堅持使用 Solr 的表現優異的基本搜索功能,也可以對它進行擴展從而滿足企業的需要。Solr 還擁有一個活躍的開發者群體,如有需要,您可以隨時向他們尋求幫助。
Apache Solr 是一個開源的搜索服務器,Solr 使用 Java 語言開發,主要基于 HTTP 和 Apache Lucene 實現。定制 Solr 索引的實現方法很簡單,用 POST 方法向 Solr 服務器發送一個描述所有 Field 及其內容的 XML 文檔就可以了。定制搜索的時候只需要發送 HTTP GET 請求即可,然后對 Solr 返回的信息進行重新布局,以產生利于用戶理解的頁面內容布局。Solr 1.3 版本開始支持從數據庫(通過 JDBC)、RSS 提要、Web 頁面和文件中導入數據,但是不直接支持從二進制文件格式中提取內容,比如 MS Office、Adobe PDF 或其他專有格式。
搜索引擎solr環境配置、分詞及索引操作
摘要隨著信息時代的來臨,人們的生活、學習、工作和娛樂已經與信息技術充分的融為一體。隨著群眾對互聯網參與度的增加和企事業單位信息化的逐步深入,信息量也成倍地增長,如何能更好地從浩如煙海的數字信息中快速、精準地查找到需要的信息,成為全國人民的迫切需求。尤其是處于信息化建設道路上的中小企業,如何快速且廉價地開放自己的信息檢索系統,對于企業的成長至關重要。本文介紹了搜索引擎的基本原理,對搜索引擎的一些核心技術進行了介紹與深入的分析;介紹了Lucene搜索引擎工具包的架構及其基本使用;對基于開源搜索引擎包Lucene的搜索框架Solr進行架構、代碼、配置等方面的研究;最后設計并實現了一個基于Solr1.3的簡單可用的多庫搜索引擎。整個設計過程致力于提高管理維護的方便性和可擴展性。
Solr 是一種可供企業使用的、基于 Lucene 的搜索服務器,它支持層面搜索、命中醒目顯示和多種輸出格式。在這篇分兩部分的文章中,Lucene Java? 的提交人 Grant Ingersoll 將介紹 Solr 并向您展示如何輕松地將其表現優異的全文本搜索功能加入到 Web 應用程序中。 使用 Apache Solr 可以滿足所有的這些要求,它是一種開放源碼的、基于 Lucene Java 的搜索服務器,易于加入到 Web 應用程序中。Solr 提供了層面搜索、命中醒目顯示并且支持多種輸出格式(包括 XML/XSLT 和 JSON 格式)。它易于安裝和配置,而且附帶了一個基于 HTTP 的管理界面。您可以堅持使用 Solr 的表現優異的基本搜索功能,也可以對它進行擴展從而滿足企業的需要。Solr 還擁有一個活躍的開發者群體,如有需要,您可以隨時向他們尋求幫助。
需求:1. 實現SOLR主,輔服務器更新同步,每次客戶端COMMIT請求都會及時應用在輔服務器上。2. 實現MULTICORE,實際生產環境中往往會有多個搜索應用實例。
主要分為兩部分,第一部分是對《db-data-config.xml》的配置內容的講解(屬于高級內容),第二部分是DataImportHandler(屬于基礎),第三部分是對db-data-config.xml的進階
Solr 是一個帶有web界面的企業級搜索服務器。它通過http協議將xml格式的文件進行索引,通過http協議進行查詢,返回結果為xml格式。
Solr是一個開源的,企業級搜索服務器。她已經是一個成熟的產品,用于強化網絡站點的搜索功能,包括內部局域網。 她是用Java語言編寫。使用HTTP和XML進行數據傳輸,Java的掌握對于學習Solr不是必須的。除了能返回搜索 結果外,還有包括高亮搜索關鍵字,方位導航(已廣泛用于電子商務網站),查詢關鍵字拼寫校驗,自動查詢建議 和 “類似”查詢 幫助更好定位搜索。
Solr簡介說起Apache Lucene,可以說無人不知,無人不曉,但是說道ApacheSolr,恐怕知道的不多。看看Apache Solr的說明:Solr是一個基于Lucenejava庫的企業級搜索服務器,包含XML/HTTP,JSONAPI,高亮查詢結果,緩存,復制還有一個WEB管理界面。Solr運行在Servlet容器中。所以Solr和Lucene的本質區別有以下三點:搜索服務器,企業級和管理。Lucene本質上是搜索庫,不是獨立的應用程序,而Solr是。Lucene專注于搜索底層的建設,而Solr專注于企業應用。Lucene不負責支撐搜索服務所必須的管理,而Solr負責。一句話概括Solr:Solr是Lucene面向企業搜索應用的擴展。
Apache Solr 是一個開源的搜索服務器,Solr 使用 Java 語言開發,主要基于 HTTP 和 Apache Lucene 實現。定制 Solr 索引的實現方法很簡單,用 POST 方法向 Solr 服務器發送一個描述所有 Field 及其內容的 XML 文檔就可以了。定制搜索的時候只需要發送 HTTP GET 請求即可,然后對 Solr 返回的信息進行重新布局,以產生利于用戶理解的頁面內容布局。Solr 1.3 版本開始支持從數據庫(通過 JDBC)、RSS 提要、Web 頁面和文件中導入數據,但是不直接支持從二進制文件格式中提取內容,比如 MS Office、Adobe PDF 或其他專有格式。更重要的是,Solr 創建的索引與 Lucene 搜索引擎庫完全兼容。通過對 Solr 進行適當的配置,某些情況下可能需要進行編碼,Solr 可以閱讀和使用構建到其他 Lucene 應用程序中的索引。此外,很多 Lucene 工具(如Nutch、 Luke)也可以使用 Solr 創建的索引。
Solr是一個開源企業搜索服務器。她是一個成熟的互聯網搜索引擎(就像baidu,google),同時她也是一個優秀的企業搜索引擎。她是使用Java編寫的,便于進一步擴展和修改。服務器通訊采用HTTP和XML,除了一些搜索、返回結果列表常用功能,Solr還具有一些其他高級應用如:關鍵詞高亮顯示、搜索結果分類(大多數電子商務網站都可以見到)、拼寫檢查、自動建議、相似搜索結果。
SOLR搭建企業搜索平臺。
Solr是Lucene下面的一個用Java寫的開源子工程項目,它是一個非常強大的企業級搜索平臺,它的主要特征包括強大的全文檢索、高亮顯示、分面搜索、動態聚類、數據庫集成、富文本(比如word、PDF)及地理空間搜索等。Solr高度可擴展,提供分布式搜索及索引復制,它為許多世界上大的網站提供了強大的搜索服務,諸如CNet、Zappos等。Solr使用Lucene的搜索核心庫來做全文檢索,它的接口采用HTTP/XML和JSONAPIs傳輸數據,這使得它更易用并可以支持不同的語言。Solr強大的配置可以允許它被定制成各種沒有Java代碼的應用,你還可以通過擴展它的插件來獲得更多的自定義功能。