Google的偉大征程之三:語音控制及 Google Now

jopen 9年前發布 | 7K 次閱讀 Google

Google的偉大征程之三:語音控制及 Google Now

譯者注:

在《Google 的偉大征程之二知識圖譜》中,我們聊了知識圖譜的起源,發展以及背后存在著的重大意義。現在,讓我們再來看看其他的兩個科技產品:語音控制及 Google Now。它們究竟會給 Google 的明天帶來怎樣的曙光呢?


瞄向未來的「語音控制」

在意識到數字移動科技將席卷全世界的趨勢之后,Google 在自身搜索領域做出了一個不起眼,但是絕對意義重大非凡的舉動。Google 不再將搜索關鍵詞作為指引系統進行下一步的指令,它將所有的輸入都當做是人機對話的一部分。本·葛默思(Ben Gomes)拿起自己的手機開始解釋:「很明顯,當你拿著這樣的數字設備時,語音控制會變得非常重要。人們說話比打字會更加自然,也更加符合人性化的需 要。」

這種變動不僅僅讓搜索引擎處理搜索請求的方式大大不同,它還意味著改變我們用戶本身的使用習慣。我們現在要試著對空白的搜索區域說話,無論是電腦還是手機,你要將其當成一個人來似的說話。

想要做到這樣的轉變需要兩個先決條件。第一點,Google 的搜索引擎必須在語音識別上下大工夫。它必須要做到像人一般的去理解與文字相比更加混亂曖昧的口語,準確的將語音分解成正常的語法結構并且解讀之;第二 點,當人們對著手機說話,又或者機器將語音轉化成文字的時候,系統能夠了解到之前人們之前在談論什么。即當時的語境是怎樣的。曾經 Google 就在語音識別領域嘗試了一番。項目經理耶叔華表示:「我們在很多年之前就相信語音、自然語言處理都將是非常重要的科技領域。它們都有一些技術瓶頸制約著發 展,需要幾年時間去開花結果。所以那個時候我們就已經投入到其中了。」

曾經就有一個名為 Google 411 的服務,它做的事情就類似于電話黃頁公司。用戶撥打了電話,就能找到比如某個餐館或者聯系人的聯絡方式,當然這也是收費的。在這個過程中,Google 將數百萬的電話錄音收集起來,然后將這同一種語言(英語)轉化成不同國家和地區的語言以及各種各樣的口音。這項技術在后來被證明是非常有用的。之所以當時 并沒有受到人們的重視,主要是因為 Google 在當時還沒有采集到 2500 個左右的短語,這些短語會幫助它從語法上對語音進行逐句的解析。那個時候公司派出去很多小組,去往全世界各個地方,告訴那里的人們公司準備采集語音樣本。 無論是在香港街頭,還是巴黎的地鐵站,都能看到 Google 小組成員忙碌采集語音樣本的身影。

這樣的付出是有回報的。Google Search 現在可以處理 159 種語言,語音搜索能夠處理其中的 58 種語言。Google 還宣布其 app 應用的「單詞錯誤率」已經下降到了 8%。辛格爾的助理本·戈米斯(Ben Gomes)很驕傲的見證了 Google 在此處的進步。之前公司曾經找來一個專家,一個能夠操持最標準的美國口音的家伙來給 Google 語言識別做測試。而戈米斯是斷然不敢上前去做什么口音測試的。因為出身印度的他的口音非常不標準,甚至 R 這個音都發不出來。現在,公司已經不需要那個標準美國口音的男人來做測試了,而戈米斯也能夠欣然走上前來,對著機器做語音識別測試。Google 識別語音的水平由此可見達到了什么程度。

在手機對人進行反饋的時候,Google 也有自己的看法。這種反饋是應該傾向于以 Siri 為代表的擬人化,似乎具有人格特征的方式呢?還是要如機器人一般的語調,提示給人們別忘了你們是在跟一個機器,或者一個系統進行交流而非人 類?Google 選擇了后者。Google 的搜索設計負責人威力表示,如果你真的想讓機器表現地跟人一樣,你必須掌握如皮克斯在動畫世界里的大師一般的高超技藝才可以做得到。而反觀 Google 本身在計算領域做出的對人的語言和行為的了解來看,已經讓人們感受到足夠舒服就可以了,不需要較真那么多。

當「語音控制」與「知識圖譜」相遇

在 Google 的研發團隊中,享有「榮譽科學家」美稱,在自然語言處理領域研究了三十年的資深專家費爾南多·皮爾瓦(Fernando Pereira) 表示:Google 在如何識別搜索請求,以及將其與網絡及其他地方而來的資料進行比對分析上已經到了非常高精尖的程度。但是加入諸如知識圖譜這樣的數據到搜索引擎中,既帶來 了機遇又帶來了挑戰。「你很難保證你所使用的語言和當時設計的數據庫能完全匹配上。」他這么說道。

這是很困難的。比如 Google 得到了這樣的搜索請求:「巨人隊在哪里比賽?」為了解答這個問題,系統必須事先了解很多事實。比如這牽扯到體育,一支在主場進行比賽的隊伍。同時它還得做 出判斷,這個「巨人隊」到底是壘球隊還是足球隊?用戶是想知道這支球隊經常比賽的場地呢?還是在下個星期的比賽場地?Google 會利用用戶曾經的上網搜索行為對這個答案進行進一步地修正。皮爾瓦說道:「所有這些推斷而來的信息,所有校準之后的信息,這都是我們幾年前不曾做到的 事。」

當然這一切還并不完善。當這一切障礙全部掃清的時候,Google 的自然語言處理系統就會將「知識圖譜」提升到另外一個臺階上。戈米斯表示:這就讓「知識圖譜」有能力自行了解發掘這個世界。在搜索請求發出一半、又或者是 模糊不清的時候,Google 就能夠猜到用戶想問的是什么。戈米斯拿大衛·卡梅倫(David Cameron) 舉例。如果一個人對著手機說出「大衛·卡梅倫」這個名字,系統已經知道這個詞曾經被無數次的說出,這個名字的主人是個男性。所以在接下來的搜索結果中會使 用「他」這個代詞。另外,如果手機就算沒有正確捕捉到卡梅倫的發音,從模糊識別的角度出發,知識圖譜會意識到你有可能在說的是英國首相。

如果用一句話來總結的說,那就是 Google 被使用得越多,它就越了解你。

現在,輪到 Google Now 登場了。Google的偉大征程之三:語音控制及 Google Now

在 2004 年,我曾經采訪過拉里·佩奇(Larry Page)以及謝爾蓋·布林(Sergey Brin)。我問他們關于 Google 搜索的遠景是什么。他們說,其遠景就是當人們開始在想某件事,但是對這件事又不是很了解的時候,你會自動的得到這些信息。」

在 2010 年,巴里斯·格特金(Baris Gultekin) 以及安德魯·柯斯米(Andrew Kirsme)這兩位工程師就是在這樣遠景的鼓舞之下,開始了名為「百分之 20」的項目,這個項目在之后成為了 Google Now。

哥特金是這么介紹的:「這個項目之所以能夠開啟,是因為我們相信現在的手機還不是足夠智能,但是它們都是能夠升級成足夠智能的版本的。如果你能將這些具有超強硬件水平的移動數字設備和 Google 的強大結合到一起了呢?」

換句話說,Google Now 會代替你來回答你要么出于懶,要么出于忙而沒有機會問出來的問題。這個功能所涵蓋的領域是如此的寬泛,需要集合多個領域的知識才能解決某一個擺在人們面前 的棘手難題。哥特金當時在開發這樣一個系統的時候就立刻感覺到老虎吃天無處下爪。但是很快,他和他的伙伴就開始將所能提供解答服務的范疇縮小到了一個領 域:即人們通勤途中。不過即便范圍如此明確單一,但是要完美地實現上述功能仍然需要大量信息進行支撐,比如家和辦公的具體位置,兩點之間最優的路徑選擇, 往返路途中的交通工具。當然知道如何正確導航的 Google Maps 在開發過程中起了很好的推動作用。很快,他們有了一款非常了不起的移動應用能夠幫助人們更好地選擇上下班的時間、路徑和方式。但是古特金表示,他們當時不 想將這個移動應用做成簡簡單單的通勤 App,他們要將其開發成一款能夠主動發揮作用的生活助手,幫助用戶處理多個生活情境中的問題。

于是,在 2012 年的 7 月,Google Now 正式上線,其中包含了 7 大生活情境:上下班、飛機航班、體育賽事、查看附近地點、旅游、交通樞紐、以及天氣。現在它已經從這 7 個領域擴展到了 70 多個。

Google Now 的作用就體現在將對世界萬物信息的歸納匯總,所有 Google 搜索所能夠提供的信息(其中也包括了知識視圖),與大量存在著的個人信息進行連接。難怪會有人聲稱 Google Now 就是未來 Google 在現實中的提前映射。每一次 Google Now 都會在人們最需要的時候,及時地推送出來一張「卡片」。這個服務是建立在 Google 多項服務基礎之上。一個標準的卡片包括了私人信息中的郵件、日歷、聯系人信息、公眾運輸系統、交通流量、以及天氣。

人們往往都不太清楚 Google Now 的能力極限到底在何處。打個比方,當你把車停靠下來,Google Now 就會在那個特定的時刻記錄下來你停車的地點,以防止你忘了找不到車停哪兒了,如果你的郵件顯示你正在找附近能夠住宿的房間,Google Now 就能夠推送目前在你附近存在的空房,以便你挑選哪個才是今晚理想的過夜居所。當 Google Now 不斷演進,它從之前的名字「20% 項目」演進成了全天候的服務項目。但是 Google Now 的開發在 2011 年獲得了極大地推動,原因在于那個時候 Apple 推出了 Siri,這在 Google 公司內部造成了些許的震動。在這之后,Google Now 已經開始飛速進化,最終將讓所有個人定制化的信息全部都能夠在登陸后的界面中顯現出來。古特金表示:「搜索和 Google Now 是兩個相輔相成的服務。我們在你搜索之前就給你必要的信息,但是還有很多情況我們不知道你什么時候需要。搜索服務能夠極大的幫我們彌補這一點,讓我們更加 了解你。」

與舊版的搜索服務相比,Google Now 只有在你全面地使用 Google 的各項服務之后才能發揮最大的作用。拉里配奇曾經說過:「搜索就是理解你的需求,將你所需要的一切推送到你的面前。」這是一個屬于 Google 完整的生態系統,將郵件、日歷、地圖、詞典、Google Now 等各個服務全部整合到一起。如果你想使用 Google Now,而 Gmail 并不是你的首選郵箱,你估計不太可能充分享受到 Google Now 甚至 Google 搜索的最大化價值。

Google 很有目的性地設計 Google Now,避免讓它成為一個獨立的產品。它的 app 并沒有貼上所謂「搜索」的標簽,而是僅僅將其稱之為「Google」。這也就能看出 Google Now 對于 Google 來說是具有多么重要性的產品了。

另外要指出的是,Google Now 的這款服務是一項可選擇開啟或者關閉的服務。每個人都可以在開啟它之前會考慮一下后續所牽扯的個人隱私問題。這個產品所提供的服務無所不在,無時不在,很 難不讓人擔心起這個大公司在窺視著每個人隱私生活的點點滴滴。當 Google 對我們的個人生活和信息越來越了如指掌,人們開始覺得不安。這在歐洲體現地尤為明顯。在那里,政府不斷推出法案,開罰款甚至發出禁止從業的威脅來阻擋 Google 前進的腳步。Google 這家公司的雄心壯志很有可能被人們對隱私的擔心而受到阻撓。即便是對于那些信任 Google 公司的人來說,斯諾登一案的出現,顯示了政府離每個人隱私生活是多么得近。是啊,如果 Google 都能知道你的車在哪兒停著,那聯邦探員有什么理由不知道呢?

阿密特·辛格爾表示:搜索的第一個時代是將人機交互的視覺化,但是人機之間仍然具有某些無形的「墻」作為主要特征。而現在的新時代,我們所逐漸 進入的這個全新的時代,人與機器更加交匯融合,曾經無形的「墻」開始消弭。我們期待搜索在針對個人信息給出的答案的有效性、準確性、及時性將等同于甚至超 過曾經的那個從無數的網頁、文件以及公共數據庫中挖掘信息的傳統互聯網時代。

辛格爾表示:「我認為搜索本身就是所有計算形式的交互界面。當所有的科技設備變得越來越小,越來越隱藏于人們的沈國里,你該如何與它們交互呢? 絕大多數的時間里,你需要采取某個行動,也許簡單如播放一下音樂,簡直復雜如寫一個提醒告知處在雜貨店附近的我去買牛奶,又或者發出諸如「我老婆的航班準 時嗎?」以及「巴拉克·奧巴馬究竟有多高?」這樣的提問。

有些人會對這樣的改變習以為常,視之為理所當然,還有一些人會開始抱怨 Google 已經不是從前他們所熟悉的那個 Google 了。所謂眾口難調的涵義就體現在這里吧。辛格爾承認還有很多問題需要解決,但是他現在能驕傲的宣布,當再有孩子問出“天空為什么是藍色”這個簡單的問題的 時候,父母們不會再翻書,也不會趴在電腦跟前查找答案,Google 本身就能自動給出那個讓幼小的好奇心滿足的答案。

Google 的征程然而并非在此打住,在下一章節,我們會看到 Google 是以怎樣夸張的方式來探尋人們的信息需求的。Google 不僅僅渴望了解整個世界,它更渴望了解人們的內心……

來自: tech2ipo.com

</div>

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!