Google 搜索背后的數據
對于互聯網用戶來說,搜索是一件非常簡單的事情。在搜索框輸入關鍵詞,回車(或點擊搜索框),等待。而對于搜索公司來說,這是一個復雜的技術問題。從你開始搜索到獲得結果的短暫時間里,究竟發生了什么?從 Google 發給 Mashable 網站的這副信息圖里,我們可以了解到一些相關的數據。
搜索之前
在你進行搜索之前,Google 的搜索爬蟲已經走遍了整個網絡,它們從一個鏈接跳到另一個鏈接,將數據帶回 Google 的服務器。網絡就像是一本書,Google 的工作就是為圖書建立目錄。
Google 建立的目錄,其容量已經超過 1 億 GB。目前為止,Google 已經花費了 100 萬個小時來構建目錄。
搜索之時
從 查詢開始到獲得結果,搜索查詢的平均旅行路程是 1500 公里。在此過程中,它可能經過全球不同的數據中心。根據 Google 的說法,1500 是一個平均數字,具體到每次搜索產生的路程不會這么長,因為 Google 總是會尋找最近的數據中心。在用戶鍵入搜索查詢的時候,Google 就開始提供對查詢的預測,以減少鍵入時間,這就是 Google Instant。
排名
Google 的排序算法會根據 200 多個信號來決定相關結果。每年,Google 對排序算法有 500 多項改進。這些信號包括:
網頁內容的新鮮程度;網站內容的質量;網頁的地址和標題;其它網站對某特定站點的鏈接,以及這些鏈接的權威性;最好的搜索結果是什么,網頁、圖片、視頻、新聞、個人結果等;網頁上的單詞;拼寫檢查;個性化(與你關聯的人推薦的結果)。
搜索結果
搜索結果根據相關性排序,同時,Google 還提供了網頁預覽功能。
每天在 Google 上產生的搜索超過億次;網頁預覽的平均加載時間是 1/10 秒;從 2003 年以來,Google 已經回答了 4500 億個新查詢;每天都有 16% 的新查詢出現。
載自: 愛范兒 http://www.ifanr.com/100339