谷歌深度學習系統超預期 人類已無法經理解電腦想法
雖然科幻電影描繪人工智能已經到機器能夠獨立思考的程度,但在現實生活中,受限于硬件設備的處理能力和編程邏輯的復雜性,我們身邊的的人工智能仍然顯得比較幼稚和容易理解——畢竟人類創造了所謂的人工智能,它們不可能超乎人類所能理解的范疇發展。
但谷歌的“深度學習(deep learning)”系統卻顛覆了這一常識,谷歌的工程師都表示這套原本只是用來做實驗的決策計算機系統表現超乎想象,它通過照片識別事物的能力早已超乎了谷歌工程師的預料,谷歌工程師甚至已經不知道計算機究竟在“想”些什么了。
識別系統的基礎
谷歌軟件工程師 Quac V. Le 在上周五舊金山的機器學習大會(Machine Learning Conference)上談到了這套深度學習系統。這是一套包含了大量服務器群,能夠收集并自動對數據作歸類的系統,谷歌打算用它來深度研究 AI 技術。在谷歌手中,此系統的服務應用包括了 Android 的語音控制搜索、圖片識別和谷歌翻譯。
深度學習系統曾在去年 6 月份引起過不少討論,當時紐約時報刊文稱谷歌的 DistBelief 技術(一個采用普通服務器的深度學習并行計算平臺)在獲取數百萬 油Tube 視頻數據后,能夠精準地識別出這些視頻的關鍵元素:貓。未來,這套系統或是能夠準確識別谷歌街景照片中門牌號碼、網站中人臉圖片等的技術依托。
深度學習技術理論上也是分層結構。其神經網絡的最底層可檢測到圖片像素在色彩上的變化,上層隨后可了解圖片中出現特定事物的邊緣部分。位于再上層的幾個連續的分析層可通過系統的不同分支學會人臉、搖椅、計算機等各種類型事物的檢測方法。
它們真的在“獨立思考”
Quoc V. Le 說,令他最為震驚的事情是,深度學習系統能夠輕易地學習總結出類似碎紙機等物體的特性,這些甚至是普通人類難以輕易做到的。“怎樣在系統設計中讓軟件能夠具備識別碎紙機的能力,這是相當復雜的。我在這方面花了很多的時間,但就是難以完成。”
實際上 Quoc 也曾給身邊的好多朋友看了碎紙機的照片,但在隨后的識別過程中,具有高等智慧的人類卻遭遇了麻煩。而谷歌的深度學習計算機系統則在這方面具有極高的識別成功率,可關鍵問題是,Quoc 自己也不知道他所寫的程序是如何做到這一點的。
也就是說,谷歌的工程師們已經無法解釋這套系統識別事物的方法和邏輯,它們更像是脫離了其創建者的控制在獨立思考,這種復雜的認知方式更是令人 不可思議。雖然這種層面的“獨立思考”范圍還非常有限,但在實際應用中卻真實有效,能夠解決實際問題。谷歌負責 AI 研究的主管 Peter Norvig 認為這種能夠實現大量數據統計的模型對于解決如語音識別與理解一類的復雜問題具有非常積極的意義。
結論
Quoc 說,對谷歌而言,深度學習系統能夠解決人類所不能解決的問題,自然也就是節約人力成本的好東西。將其更多的潛力挖掘出來,總好過雇傭一批每年拿著無數酬勞 的高級專家。“機器學習非常復雜,我們需要花大量的時間在數據處理和特性更新上。甚至為了解決一個獨立的問題,我們就需要聘請這一領域的專家。以后我們期 望能夠跳脫這樣的模式,我們沒法解決的問題,就讓機器去完成。”
而且谷歌實際也在開發其他類似的決策選擇系統,如 Borg 與 Omega,這些系統在分配工作負荷時,行為方式也更像是活物。將來,機器的“獨立思考”或將真正成為可能。至少現在,我們讓計算機與人類達成了這樣的協作關系。