Elasticsearch知識手冊
Elasticsearch是一個實時分布式搜索和分析引擎。他讓你可以以前所未有的速度處理大數據成為可能。
它用于全文搜索、結構化搜索、分析以及將這三者合并:
-
維基百科使用Elasticsearch提供全文搜索并高亮關鍵字,并提供輸入即時搜尋(search-as-you-type)和搜索糾錯(did-you-mean)等搜索建議功能。
</li> -
英國衛報使用Elasticsearch綜合用戶日志和社交數據提供實時的反饋給他們的編輯,以便及時獲得公眾反饋。
</li> -
StackOverflow將全文搜索與地理位置和相關信息進行結合,以提供more-like-this功能來找到相關問題的答案。
</li> -
Github使用Elasticsearch檢索1300億行的代碼。
</li> </ul>但是Elasticsearch不僅用于大型企業,它還讓像DataDog以及Klout的創業公司將最初的想法變成可擴展的解決方案。Elasticsearch可以在你的筆記本上運行,也可以在數以百計的服務器上處理PB級別的數據。
Elasticsearch每個獨立部分都不是創新或者革命性的。在全文搜索中早已被實現,統計系統和分布式數據庫也早已存在。它的革命之初在于整合這些獨立的功能在單一的、連貫的和實時的程序中。它對新用戶的門檻很低,當然它也會跟上你技能和需求增長的步伐。
你之所以拿起這本書,是因為你有數據,在用這些數據計劃做些事情前并不知道怎么去使用它們。
很不幸,現在很多數據庫對于提取可用只是方面非常無能。當然,它們能夠通過時間戳或者精準字段值過濾,但是能夠執行全文搜索,處理同義詞和根據相關性給文檔打分嗎?它們能夠生成分析和聚合相同內容數據嗎?最重要的是,面對如此龐大的數據,它們能夠做到實時處理嗎?
這就是Elasticsearch存在的理由:Elasticsearch鼓勵你瀏覽并利用你的數據,而不是讓它爛在數據庫里,應為在庫里太難查詢了。
Elasticsearch是你最好的朋友。
http://looly.gitbooks.io/elasticsearch-the-definitive-guide-cn/content/010_Intro/00_README.html