一篇文章看懂谷歌的人工智能帝國,為什么這里一切都是 AI ?
2015年11月9日,谷歌宣布開源機器學習平臺TensorFlow,讓每個人都可以利用計算機和網絡去使用這個強大的機器學習平臺。谷歌旗下 的50多個產品都運用了TensorFlow深度學習系統(機器學習的深度神經網絡),它已變為一家機器學習公司,其產品不斷地給世界創造價值。
TensorFlow:人工智能領域的安卓系統
TensorFlow是一個數據庫,研究人員和計算機科學家可以利用它來構建數據分析系統,讓計算機利用數據進行決策。
機器學習的核心是讓機器讀懂數據并基于數據做出決策。當數據規模龐大而又非常復雜時,機器學習可以讓機器變得更聰明。TensorFlow在數據輸入和輸出方面都有驚人的精度和速度,它被確切地定義為人工智能工具。
以下是關于TensorFlow的一些細節。TensorFlow系統使用圖表數據流,在這個系統里,多個維度的數據在不同的數學計算體系中流 轉。這些復雜的數據被稱為“張量”(tensor),數學體系中流轉著 “節點”(node)。數據在不同的節點之間流轉,就能告訴系統不同數據之間的關系。張量在節點中流轉,也就是TensorFlow名稱的來由。
谷歌開源TensorFlow,這意味著無論是研究人員還是大學生都可以使用這一專業軟件。但更深層的是對機器學習公司研究的影響。無論是創業公 司還是行業巨頭,都可以根據自身需要使用TensorFlow,即使是用其來開發與之競爭的產品。而谷歌可以借此在人工智能界樹立權威。
斯坦福大學計算機科學的Christopher Manning教授在三個月前被授權提前試用TensorFlow來給學生授課,僅僅幾周后,Manning教授就決定要在他的課程上長期使用它。
Manning教授表示,有人認為TensorFlow像安卓,但它也有點像Gmail——Gmail比眾多競品都簡潔高效。“并不是說之前沒有這樣的深度學習資料庫,但那些產品就像是幾名學者和大學生一起打造的。”
在TensorFlow的競品中,比較有名的是Torch和Theano,這兩個數據庫都由小型團隊不斷更新升級,但谷歌在機器學習方面的投入可 不止如此。Manning教授指出,TensorFlow開源對機器學習社區是一份大禮,神經網絡的運行速度提高了100倍,這也讓谷歌受益匪淺。
“已經有部分公司雇傭了大量優秀人才來開發人工智能,尤其是深度學習。谷歌不是慈善機構,他們在推出TensorFlow之前肯定就預想到,將有很多博士生受益于這個深度學習系統。”Manning教授說道。
研究員湯姆·迪里希說,即使谷歌員工們可以看到你的照片,他們也不會將其用于公司研究。
Jeff Dean是谷歌的高級工程師,他和Rajat Monga可稱作是TensorFlow的締造者。Dean認為,很難估測機器學習社區對TensorFlow的使用率有多高。雖然谷歌認為它用處很大, 但關鍵在于機器學習社區是否也這樣認為。當初設計這樣的一個工具就是為了更快地把機器學習的理論變為現實。
“不錯,我們希望加速機器學習的研究和發展。機器學習社區一直不斷涌現驚人的理論,這是好事,但卻沒有驚人的成果。”Dean說道,TensorFlow是谷歌給機器學習社區的一份大禮,最理想的情況是,機器學習社區可以飲水思源,分享他們的研究成果。
Dean表示,TensorFlow還可以讓谷歌的實習生實現云辦公,利用課余時間在學校完成工作。
對于研究人員來說,TensorFlow系統是一個完整的工具包,集成了相關工具和Apache2.0協議,在商業中使用也十分方便。TensorFlow可以在電腦中編譯,也可以在移動設備上操作,目前安卓操作系統已經開放,iOS還需稍等時日。
TensorFlow系統還配備了詳盡的使用教程,幫助用戶更快上手。
Manning教授認為,TensorFlow可以在移動設備上操作的特性將是它和其他開源系統區別開來的關鍵。
對于現在就想嘗嘗鮮的開發者,谷歌提供了一個TensorFlow的開發者版本。它內置大量API接口,軟件開發者可以輕易操控他們的TensorFlow模塊。目前,TensorFlow已被應用到谷歌的50多個APP中了。
探訪谷歌人工智能實驗室
TensorFlow平臺的開放,讓我們有機會窺探谷歌的機器學習系統。
實際上,谷歌為了推出這個龐大的人工智能平臺,已經默默付出了三年的努力。谷歌更希望人們稱它“機器智能”。他們認為“人工智能”這個詞包含太多言外之意,他們想打造的是可以應用于機器的智能。
在公司內部,TensorFlow已被使用多年。如果工程師對人工神經網絡感興趣,他們可以自由地修改系統。這樣開放的結構讓公司內部的100多個團隊對這一強大的機器學習技術做出了貢獻。
“機器學習是我們重新定義行為的核心變革方式。我們希望在自身所有的產品中使用機器學習,包括搜索、廣告、油Tube和Play商店。雖然機 器學習還處于早期階段,但我們將逐漸把它系統性地運用到這些產品中。”谷歌首席執行官Sundar Pichai在今年10月的季度報告會上表示。
歡迎來到谷歌,這里一切都是AI,AI就是一切
很難列出一個谷歌機器學習的研究體系,因為它一直在變化,并且和公司里的每一支團隊都脫離不了干系。
John Giannandrea是谷歌的工程副總裁,他提出了“嵌入型”的概念。2015年秋天,Popular Science的記者在加州山景城的谷歌總部采訪了他。
當時,記者走進谷歌大樓內部,發現谷歌研究室被嚴實地保護著,什么都看不到。當他準備離開時,一個工程師注意到他沒有佩戴員工徽章,過去向他詢問。記者說,他是一個作家,谷歌自稱其研究對公眾開放,但谷歌研究室卻安保嚴密。
谷歌總部面積約3.3萬平方米,員工騎著自行車穿梭在一棟棟建筑間,每棟辦公樓都被公園似的綠地包圍著。午休時間,員工們打開手提電腦坐在草坪上,不知道是在應付科學難題還是玩游戲。不同團隊在不同辦公樓里工作,研究人員要隨著團隊的更換而隨時更換辦公室。
在辦公樓內部,一切看起來都很平常。辦公室有隔間、數不清的電腦顯示器、壓低聲音討論工作的員工,還有員工們為了小憩而準備的抱枕和睡袋。
谷歌山景城總部,研究人員正在解決機器智能的問題,一起看起來和一般辦公室沒有什么區別。
谷歌機器智能被不斷優化升級,這項技術關系到谷歌的核心產品,包括相片應用、語音搜索和搜索引擎。
此外,Giannandrea還特別提出了手寫產品。
“谷歌想了解人們寫字的秘密,盡管我們現在還沒有相關產品,但不排除這將成為我們的投資方向。”
谷歌的產品體系是如此龐大,某些工具在不同的產品中往往是通用的。
一般來說,谷歌的研究人員都是根據興趣分組的。一個團隊專注于圖像識別,一個團隊專注于語言理解,還有一個團隊專注于語音識別等等。
“如果世界沒有谷歌,就別想有更好的語音識別、語言理解和翻譯技術了,這些前沿技術一直都是谷歌的重點投資對象。”Giannandrea說道。
目前,超過1000名員工致力于研究谷歌機器智能,在理論和實踐中不斷進行修正和優化。
谷歌發言人Jason Freidenfelds表示,谷歌的母公司Alphabet從來沒有干涉谷歌的機器智能研究,未來也將如此。谷歌研究團隊與Google X實驗室和Life Sciences公司的合作將持續進行。
來自未來的聲音
谷歌的語音搜索正成為一顆冉冉升起的新星。即使不清楚它到底是什么,但你可能已經在不經意間使用過:谷歌的搜索欄下面有個小麥克風圖標,當你點擊 的時候,就可以用語音而不是文字來進行搜索。這個功能同樣也適用于iPhone和安卓版的谷歌搜索應用。許多安卓智能手機的自帶搜索欄也有這個功能。
表面上看來,谷歌語音搜索已經成為了僅次于Siri的第二大網關知識庫。
雖然谷歌沒有公布語音搜索和文字搜索的使用比例,但卻公布了另一個數據:谷歌移動端搜索比谷歌電腦搜索的使用率更高,移動語音搜索的使用率在去年翻了一番。超過50%的美國人知道谷歌語音搜索,其中三分之一的人使用過這項功能。
每一年,算法都會迭代幾百次,搜索功能也不相上下。要讓人們自如地和機器說話并非易事。
高級研究員Fran?oise Beaufays致力于開發語音搜索背后的語音識別引擎,他表示,隨著谷歌語音搜索不斷優化,使用的人數會越來越多。
“我們剛開始做語音識別時,用戶并不是很感冒我們的產品,因為當時的語音輸入有滯后性。但現在,語音輸入大大提速,辦公室里的人們已經可以自如地運用語音做任何事情了。”Beaufays說道。
Beaufays說話快的時候帶有點法國口音,但一般情況下神經網絡架構還是可以理解她的語音。她帶領她的團隊為搜索引擎更換了新的語音識別系統,這個新系統利用的是遞歸神經網絡,更加高級。
機器若要理解語言,首先要知道單詞和短語聽起來是怎么樣的,這意味著它要消化帶有不同口音的大量音頻文本。算法對這些文本進行處理,把它們加工成相應的關聯圖,再讓機器消化。讓計算機剪輯一個音頻,它會通過算法生成波形圖并進行分析,然后選擇最佳的方式進行剪輯處理。
Beaufays解釋道,這相當于把聲音拆分成一個個單詞來理解和處理。
這一切都依賴于原始的音頻文本,也叫做訓練數據。它是由數百萬谷歌搜索用戶提供的真實聲音。每當你用谷歌進行語音搜索時,語音音頻都會上傳到谷歌服務器,如果你授權谷歌使用,那么該音頻就會被集成到剪輯庫,用以訓練機器。
但數據在使用之前,要經過幾個步驟的處理。首先,擦洗掉音頻中所有的用戶信息,包括時間、位置、用戶配置信息等。然后,人工對該音頻進行處理,因為算法需要可靠的文本進行分析。有時候研究人員會在音頻中添加噪音,以讓機器可以理解一個單詞在不同環境下的含義。
Beaufays強調,用戶對這些信息是有知情權和選擇權的。谷歌收集世界各地人們生活中的信息,這涉及隱私,只在用戶許可的情況下谷歌才會進行語音采集。如果你不希望谷歌使用你的聲音,就不要勾選許可選項,谷歌會在搜索完成后會刪除你的語音數據。
這樣的訓練讓語音搜索更加高效。谷歌公布的數據顯示,兩年前語音搜索的錯誤率是25%,現在下降到了8%。
但也有人擔心,如果有一天,用戶不再授權給谷歌信息使用權,他們要怎樣訓練機器呢?
聰明的Inbox郵箱
2015年11月初,谷歌宣布將機器學習運用到電子郵件當中,涉及到的是獨立于Gmail存在的Inbox郵箱應用。Gmail的產品經理Alex Gawley表示,這是TensorFlow的功勞。
“我們的團隊的神經網絡研究在不斷加強,這項研究很可能幫助機器理解和組織語言,可以幫助人們寫郵件。”Gawley說道。
新增的功能稱為“智能應答”,在遞歸神經網絡讀取了用戶的郵件后,會生成三個備選的回復,用戶選擇一個之后它就會自動發送。
谷歌并不會讀取用戶的郵件,但是它會根據用戶的回復習慣來進行學習。由此,機器可以回答特定問題,但需要神經網絡進行修正。
我們通過“智能應答”可以一瞥谷歌的機器學習產品。Inbox團隊正在內部測試這一功能,并進行修正和優化。
整個Inbox團隊都參與了內部測試,并且給出了越來越多的信息。當這個應用在各種環境中都可以運作無誤時就會與公眾見面。
內部測試讓研究人員發現了很多Bug。例如,機器會自動生成一句“我愛你”作為回復,因為“我愛你”在私人郵件中十分常見,因此機器就把它劃為重點句子。
這些研究都是為了讓人們可以更輕松地工作,這是谷歌許多產品的一致目標,特別是個人助理Google Now。它的團隊口號是“在正確的時間做正確的事情”。Google Now的負責人Aparna Chennapragada表示,機器智能需要深度訓練后才可以內置到平臺中。
“發現問題對于人類來說很難,但是對于機器卻很容易,而且機器還比人類完成得更出色。”Chennapragada說道。
目前,谷歌的產品在探索讓人類生活變得更輕松的途徑。Chennapragada把Google Now和5年前出現的語音識別相比,產品雖好但還不完美。
目前谷歌正在探索如何利用三種不同數據為用戶提供信息,他們認為手機是一個“部分注意力集中裝置”,理想的服務不應該超出用戶所能承載的信息量。
機器智能和智能手機的終極目標是:智能手機化身真正的個人數字助理,具備超越人類大腦的知識和預測能力。為了做到這一點,你的手機需要獲取大量信息:你的日程表,你的喜好,你去的地方。這些信息唾手可得,因為手機可以記錄這一切。
谷歌知識圖譜把一切個人信息收入囊中,意味著你的世界全被濃縮到指尖的設備中,到了那時,也許連怎么去機場都要完全依賴手機了。
谷歌使用大數據的另一個例子是道路交通情況檢測。通過大量匿名用戶手機提供的數據,谷歌可以知道哪些道路交通擁堵,哪些道路順暢。同樣的方法也可以檢測出哪些咖啡店或餐館門庭若市,哪些門可羅雀,從而省去排隊的麻煩。
Google Now是谷歌運用機器智能的絕佳例子,它可以讀懂圖片在不同時代的含義,并且用幽默的口吻表達出來。
組織全世界的信息
上文提到了Google Now利用知識圖譜工作,知識圖譜究竟是什么東西?
John Giannandrea于2010年進入谷歌,是谷歌的早期研究主管。他曾經創辦了Metaweb公司,研究對象是互聯網上的相關文本和對象。
Giannandrea很早就發現搜尋信息和類似的信息片段是平行進行的。
2012年,知識圖譜發布,它囊括了強大的功能,可以自動彈出搜索內容的相關信息。比如當你搜索“Popular Science是什么時候成立的?”,谷歌會自動彈出答案:1872。
谷歌不僅改變了互聯網,也為用戶提供了更加便捷有效的途徑。這是谷歌第一次把人工智能運用到其主打產品中。從那時起,谷歌把這個為其增加了15%日均搜索量的人工智能模型稱為RankBrain。這樣的功能是傳統算法無法實現的。
Geoff Hinton是頂尖的人工智能理論家,他和許多牛人齊名,包括非死book的Yann LeCun,谷歌的Yoshua Bengio和百度的吳恩達。
和Hinton說話就像是在和未來5年的人說話似的。他表示,將矢量的文本轉化為向量,這樣機器就可以理解并記住冗長的信息。
當今的計算機程序通過查找詞庫中定義的單詞來分析文本,但最佳的方法是像人類一樣消化理解文本。
“谷歌希望機器可以提取文本,進行推理分析,理解文本的含義。如果我們做到了這一點,那么我們的產品可以為人們提供更好的解決方案。”Hinton說道。
那為什么還做不到呢?
Hinton表示,理解人類大腦并使機器與之相匹配是一個大規模的工程,當前的限制是人工神經網絡的研究人員還沒有完全參透復雜的大腦。目前我們有數以百萬計的因素可以操作,但是大腦中的信息是這個數字的10萬-100萬億倍。
雖然現實并不樂觀,但Hinton仍持積極態度,他認為人工智能的研究并沒有到達冬天。其中一個重要原因是人工智能得到不斷推廣,過去五年來的進步更是讓人欣喜,特別是在圖像和語言識別方面。這些問題在過去看起來很復雜,但隨著時間的推移,測試錯誤率不斷降低。
“機器的性能越來越接近人類,雖然不是在所有方面,但在識別等方面確實得到了極大提升。幾年前,計算機視覺專家會告訴你‘不,在幾年內我們是達不到這個水平的。’但是我們現在做到了。這就是我一直保持樂觀的原因。”Hinton說。
即使一個機器可以高度模仿人腦,但如果普通人不會使用它,那也是白搭。因此,谷歌想讓人工智能簡單化。盡管背后的技術充滿了復雜和不穩定因素,最終的結果也是多種因素作用的產物,但時間會讓技術不斷升級。
Google Now負責人Chennapragada說:“谷歌正處在魔法和神秘的中線,我們選擇神秘。”( 本文首發鈦媒體 )
【本文由鈦媒體作者黑匣編譯自popsci.com,原作者D ave Gershgorn】