Google 搜索背后的數據

openkk 12年前發布 | 7K 次閱讀 Google

Google 搜索背后的數據

對于互聯網用戶來說,搜索是一件非常簡單的事情。在搜索框輸入關鍵詞,回車(或點擊搜索框),等待。而對于搜索公司來說,這是一個復雜的技術問題。從你開始搜索到獲得結果的短暫時間里,究竟發生了什么?從 Google 發給 Mashable 網站的這副信息圖里,我們可以了解到一些相關的數據。

 

搜索之前

在你進行搜索之前,Google 的搜索爬蟲已經走遍了整個網絡,它們從一個鏈接跳到另一個鏈接,將數據帶回 Google 的服務器。網絡就像是一本書,Google 的工作就是為圖書建立目錄。

Google 建立的目錄,其容量已經超過 1 億 GB。目前為止,Google 已經花費了 100 萬個小時來構建目錄。

搜索之時

從 查詢開始到獲得結果,搜索查詢的平均旅行路程是 1500 公里。在此過程中,它可能經過全球不同的數據中心。根據 Google 的說法,1500 是一個平均數字,具體到每次搜索產生的路程不會這么長,因為 Google 總是會尋找最近的數據中心。在用戶鍵入搜索查詢的時候,Google 就開始提供對查詢的預測,以減少鍵入時間,這就是 Google Instant。

排名

Google 的排序算法會根據 200 多個信號來決定相關結果。每年,Google 對排序算法有 500 多項改進。這些信號包括:

網頁內容的新鮮程度;網站內容的質量;網頁的地址和標題;其它網站對某特定站點的鏈接,以及這些鏈接的權威性;最好的搜索結果是什么,網頁、圖片、視頻、新聞、個人結果等;網頁上的單詞;拼寫檢查;個性化(與你關聯的人推薦的結果)。

搜索結果

搜索結果根據相關性排序,同時,Google 還提供了網頁預覽功能。

每天在 Google 上產生的搜索超過億次;網頁預覽的平均加載時間是 1/10 秒;從 2003 年以來,Google 已經回答了 4500 億個新查詢;每天都有 16% 的新查詢出現。

Google 搜索背后的數據
載自: 愛范兒 http://www.ifanr.com/100339

 本文由用戶 openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!