Google的偉大征程之二:知識圖譜
在上一章節《Google 的偉大征程之一:如何攀登移動互聯網這座高山》中,我們看到了 Google 曾經的輝煌,如今隱隱顯現的危機,以及自身不斷做出的努力。在這一章節,我們將詳細介紹它其中的一款具有戰略性意義的產品:知識圖譜。
三叉戟
Google 在大的方向推出了三個實質性的科技突破,正是這三者,將繼續確保 Google 的霸主地位。其一就是 Google 所開發的「知識圖譜」(Knowlege Graph),這是 Google 從世界范圍內將數據進行全面整合之后的產品。一旦有了它,你就會更加深切、直觀、全面地了解這個世界。其二則是 Google 的語音控制功能。辛格爾面向我,抬起他手腕上的三星智能手表給我說道:「為什么要開發這個功能?因為我無法在這款手表上打字。就是這么簡單。后來我們覺得 在預測人們想要問什么的背后是應該由一些成系統的學問的,所以我們又開發出來了 Google Now,這樣人們不用老是問來問去了。」而 Google Now,就是第三款產品了。
知識圖譜在一個超級大的數據庫中重新整合世界的信息。語音搜索功能徹底將「說話」納入到了搜索領域。而 Google Now 能夠讓人們在還沒來得及提問的時候就已經給了人們想要的答案。這三者的出現絕對不是巧合,完完全全與 Google 瞄準移動互聯網的發力有關。盡管整個公司研發戰略上并不僅僅就包括這三者,但是我們已經看到了曾經的巨人,那個曾經只能給出「十行藍色鏈接」的搜索引擎, 單憑這三點內容就開始蛻變成另外的主宰者。它的功能表現不能再用計算機來形容,而更像是一個由信息組成的「智能蜂巢」,一個能夠解讀并且滿足你的信息需求 的強大工具。當你還沒有注意到它的時候,它就已經布局完成。
知識視圖的起源
在 2010 年,Google 收購 MetaWeb 公司的時候,大家都沒怎么注意。但是如今看來,當年的那次收購確確實實影響了如今搜索領域中很多重大的改進,在曾經簡單的「十行藍色鏈接」之上附加了豐富 的類似于卷宗檔案一樣的內容,涉及人物、地點、物品等等,一應俱全。
MetaWeb 是當時著名的計算機科學家及創業者丹尼·希爾斯(Danny Hillis)在 2005 年創建起來的。他曾經的公司叫做 Applied Minds,在這個公司丹尼·希爾斯曾經開發了很多創新項目,然而其中有一個項目尤為讓他覺得意義重大,以至于準備開設另外的一家公司獨立運作這個項目, 這也就是 MetaWeb 公司的起源。它于 2007 年創建。該公司在當時被稱之為「語意網絡」中進行首次重大探索
說這么學院派大家也許還是一頭霧水,簡單點兒來說,就是用某種方式將多個數據庫進行加工,將其整合到一種格式中。在這個格式下的信息會非常容易 解讀,就像是所有的東西都被收集打掃到一個巨大的貯藏室里一樣。希爾斯表示:「我們正在創建世界的數據庫,一個能夠容納世界全部信息的地方。」鑒于那個時 候 AppliedMinds 已經開始掃描互聯網來提供問題的解答服務,不少人認為 Metaweb 都是 Google 最強有力的競爭者。但是過了幾年,該公司融資了 5000 萬美金之后,希爾斯意識到他頭腦中那個絕妙的、宏偉的想法只可能成為一個更加強大的公司中的一部分,它只能在那個公司的羽翼下才能破繭成蝶。那個公司,名 叫 Google。
那個時候,其實 Google 也在為問題提供一些直接了當的答案。比如,如果你打美國總統巴拉克·奧巴馬的生日,它很快就能響應,在搜索結果的最上方顯示正確的日期:「1961 年 8 月 14 日」。但是,當 Google 在 2010 年的 7 月份,在其博客上宣布對 Metaweb 的收購時(其中也包括收購 Metaweb 的那包括了 1200 萬條容納人物、地點、事物信息的數據庫),它的搜索引擎還沒有回答復雜問題的功能。你如果打出類似的問題:「西海岸那些學費低于 3 萬美金的學院有哪些?」又或者「至少獲得一屆奧斯卡獎,現在已經年過 40 歲的演員都是誰」,Google 是沒有辦法給出答案的。同時,Google 在博客上向外界宣布,對 Metaweb 的收購會有助于提升這個功能,屆時 Google 將會針對這種極其復雜的問題給出非常準確的答案。
Google 曾經的產品經理艾米麗·莫克斯利(Emily Moxley)接受采訪時表示:「當 Google 收購了 Metaweb 的時候,Google 是非常明白收集所有信息對于搜索是多么重要的一件事。在人們所關心的問題上,它能夠給出最快的摘要和最準確的信息,這是最明智的選擇,當時我們都是這么認 為的。」
開始不斷成熟的知識圖譜及其背后的意義
在 2012 年 5 月,Google 推出了從 Metaweb 中衍生而來的東西,它的名字就叫做 Knowledge Graph(知識圖譜),它從 1200 萬個條目已經暴漲到了 5 億個條目。這個產品會給你搜索的內容提供另外一種附加的衍生出來的結果。當你搜索某些關鍵詞后,如往常一樣下面出來了很多排列好的鏈接,但是在最右邊,它 會針對你所提供的關鍵詞給出一組信息,這些信息與你所查詢的詞高度相關,往往對你來說更加有用。
那么到底哪些搜索字詞能夠觸發這個知識圖譜呢?哪些搜索字詞值得觸發呢?莫克斯利是這么解釋 Google 的做法的,她拿在維吉尼亞州,位于 Rickmond 的洲際高速公路來做比方。如果是從東北方向而來,要去向弗羅里達州的游客們應該都知道,就在 Richmond 的北邊,路線 95 的岔口那兒會有一個標示,告訴司機們你可以選擇走南北方向的主干道,直接穿過市中心,又或者選擇上 295 號線,這條線圍繞城市一圈,然后再與 Richmond 南邊的 95 號線匯聚起來。
具體到搜索領域,當你開始查詢一個字詞,Google 會將其擴展為具有高度相關性的一組字詞還有同義詞,然后對這些衍生出來的詞語進行一次算法測試,看是否符合知識圖譜上的結果。這就相當于提前在 295 號線上轉了一圈,在選擇 295 號線還是 95 號線的時候,系統已經給出了最具價值的路徑,如果繞著 295 號線能看到更多有趣的風景,那么系統自然會給你呈現出知識圖譜的相關內容了。
自 Google Search 將知識圖譜完全整合進來之后的兩年多的時間里,公司一直持續地改善這款產品。當然,Google 官方并不會說搜索字詞到底有多少的比例會觸發知識圖譜的內容,但是大致上我們可以估計得出來應該起碼有 25%。一開始,知識圖譜只是一些簡單的數據,但是這個產品開始不斷的自我進化,復制了 Google Search 中自我學習功能,開始分析用戶的上網習慣。
舉個例子吧。如果你詢問:「誰在《星球炮彈》這部電影中扮演了 Barf 這個角色?」因為系統已經在你發問之前看到無數人都提出類似的問題,它就會自動給出一個圖表,里面有演員的姓名 John Candy,電影名稱還有演員的照片。你也可以自己去試試這個把戲,打出「某部電影里的某個角色是誰扮演的?」看看系統是多么快地給出答案。
知識圖譜同樣還在另外一個重要領域帶來進步。那就是信息的及時性。鑒于 Google 往往是對一個問題僅僅提供一個正確的答案,那么這唯一的一個答案一定要保證是最新出現的,否則它就不可能稱之為最正確的答案。由于信息的不及時所導致的后 果,還不如用戶壓根不去搜索。莫克斯利表示:當知識圖譜在 2012 年第一次出現之前,大眾汽車如果決定聘請一名新的 CEO,系統估計需要兩個星期的時間才能把這個消息反饋在互聯網上;而如今知識圖譜的出現,整個系統在處理接收這些新聞,做出及時調整上只需要幾分鐘就能 做到。但是知識圖譜并非能夠滿足所有人的需要。信息傳遞時也會出現誤差。比如大眾公司已經決定聘請某某成為新 CEO,可是這哥們兒在后面的幾個月一直沒有到位入職,所以知識圖譜所顯示的仍然是現任 CEO 的信息,這對于很多想要查找新 CEO 信息的人們來說就極為不方便。
除此之外,知識圖譜還在不斷增加新的知識領域。最近它將汽車領域、視頻游戲領域、雨果獎獲獎人員信息全部納入其中。Google 不僅僅滿足于向人們提供簡單的事實,它已經不再僅僅是追求更快的搜索相應速度,給出一些高度相關的信息,它要給出更加復雜,高度集合化的搜索結果。莫克斯 利表示:「人們往往關心的不僅僅是事實本身。他們更關心一些主觀的意見看法。比如這個電視劇是不是好看。這些意見會讓知識圖譜更上一層樓的。」這樣做,似 乎 Google 是不想讓你覺得它只是一個隨手一番的字典或者查詢極其,它更想扮演一個天上地下無所不知的先知,不僅僅是了解天文地理這些客觀的知識,不僅如此,這個先知 還精通人世間所有的文化。
知識圖譜目前也是存在短板和缺憾的
但是知識圖譜還有相當長的路要去走。大家從知識圖譜上所獲得的滿足催發出了更高的期待值,然而這些期待不斷落空,轉化成失望和沮喪。莫克斯利就 曾經非常氣惱,因為她發現知識圖譜雖然知道某個電視劇,但是它卻不知道這部電視劇最新季的信息以及它們什么時候會播出。她說:「我其實就是想要它給我一個 提醒,告訴我本周我所喜歡的電視劇的新集開播啦!我同樣也想知道在哪個網站能看到它。但是目前知識圖譜還做不到。」不過她表示最終 Google 能徹底解決這些問題。
說到令人失望的部分,估計還有曾經提到過的 Google 信誓旦旦所做的保票。它曾說:以后你只要提出諸如:「西海岸那些學費低于 3 萬美金的學院有哪些?」又或者「至少獲得一屆奧斯卡獎,現在已經年過 40 歲的演員都是誰」這樣的問題,Google 能給你一個圓滿的答復。但是直到四年之后的今天,Google 仍然沒有辦法做到這一點。
在下一章節,我們將介紹另外的兩個產品:語音搜索及 Google Now,敬請關注。
</div>