Elasticsearch知識手冊

jopen 10年前發布 | 26K 次閱讀 ElasticSearch 搜索引擎

Elasticsearch是一個實時分布式搜索和分析引擎。他讓你可以以前所未有的速度處理大數據成為可能。

它用于全文搜索、結構化搜索、分析以及將這三者合并:

  • 維基百科使用Elasticsearch提供全文搜索并高亮關鍵字,并提供輸入即時搜尋(search-as-you-type)搜索糾錯(did-you-mean)等搜索建議功能。

    </li>

  • 英國衛報使用Elasticsearch綜合用戶日志和社交數據提供實時的反饋給他們的編輯,以便及時獲得公眾反饋。

    </li>

  • StackOverflow將全文搜索與地理位置和相關信息進行結合,以提供more-like-this功能來找到相關問題的答案。

    </li>

  • Github使用Elasticsearch檢索1300億行的代碼。

    </li> </ul>

    但是Elasticsearch不僅用于大型企業,它還讓像DataDog以及Klout的創業公司將最初的想法變成可擴展的解決方案。Elasticsearch可以在你的筆記本上運行,也可以在數以百計的服務器上處理PB級別的數據。

    Elasticsearch每個獨立部分都不是創新或者革命性的。在全文搜索中早已被實現,統計系統和分布式數據庫也早已存在。它的革命之初在于整合這些獨立的功能在單一的、連貫的和實時的程序中。它對新用戶的門檻很低,當然它也會跟上你技能和需求增長的步伐。

    你之所以拿起這本書,是因為你有數據,在用這些數據計劃做些事情前并不知道怎么去使用它們。

    很不幸,現在很多數據庫對于提取可用只是方面非常無能。當然,它們能夠通過時間戳或者精準字段值過濾,但是能夠執行全文搜索,處理同義詞和根據相關性給文檔打分嗎?它們能夠生成分析和聚合相同內容數據嗎?最重要的是,面對如此龐大的數據,它們能夠做到實時處理嗎?

    這就是Elasticsearch存在的理由:Elasticsearch鼓勵你瀏覽并利用你的數據,而不是讓它爛在數據庫里,應為在庫里太難查詢了。

    Elasticsearch是你最好的朋友。



    http://looly.gitbooks.io/elasticsearch-the-definitive-guide-cn/content/010_Intro/00_README.html

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!