谷歌“學習機器人”:像人類大腦一樣去思考

jopen 11年前發布 | 15K 次閱讀 谷歌

  讓機器像新生兒的大腦一樣進行自我學習和思考,這聽上去不可思議的場景正在谷歌代號為“Google X”的秘密研發部轉變為現實。

  近日,Google 科學家杰夫·狄恩(Jeff Dean)告訴《第一財經日報》記者,“Google X”實驗室通過連接 16000 臺計算機處理器,創建了一個機器學習的神經元網絡系統。結果發現,這個系統自己學會了對貓的辨認。

  去年夏天, Google X 利用這一由 16000 多個處理器、10 億個內部節點組成的虛擬大腦,分析了 1000 萬幀從 油Tube 上隨機抓取的無標簽視頻剪輯圖片,經過了 10 天時間的運轉,“大腦”終于認識了什么是貓,并從接下來輸入的 2 萬張圖片中準確找出了貓的照片。

  和傳統的機器視覺技術不同,它們是根據人類的指令進行學習,從而識別出某些特性。但在谷歌研究中,工程師們無需預先向機器輸入某一概念,該系統就能在并未得到任何外在幫助的前提下“自學成才”。

  “我們在訓練的時候從未告訴過那是‘貓’,系統只是自行創建了貓這個概念。”杰夫·狄恩告訴記者,“大腦”是自己從未標記的 油Tube 靜態圖片中發現了貓是什么樣子,這就是“自我學習”。

  他向記者解釋谷歌機器學習的理念:用眾多的電腦模擬人腦中的“神經元”,形成一個“神經網絡”。它不需要借助大批研究人員幫助電腦標明事物之間的差異,只要為算法提供海量的數據,“神經元”與“神經元”之間的關系將會發生變化,讓數據自己說話,讓組成“神經網絡”的機器具備自動學習、識別數據的能力,在新的輸入中找出與學到的概念對應的部分,達到識別的效果。

  例如,在看過數百萬張圖片后,谷歌的虛擬大腦將自己構建出一張理想的貓的圖片,利用不同層級的存儲單元成功提煉出貓的基本特性。有科學家認為,這似乎是在控制論層面模擬了人類大腦視覺皮層的運作方式。

  不過這一機器學習技術并不僅僅局限在圖像方面。目前,Google 正在將該虛擬人腦用于提升語音識別的準確率。杰夫·狄恩介紹,GoogleX 團隊曾和谷歌語音識別團隊有過一次合作,5 天內在 800 個機器上進行訓練,就單字錯誤檢出率而言,該系統已讓 Google 的語音識別準確率提升了 25%,這相當于研究語音識別 20 年的成果。

  但目前,這一研發只有一年半的實驗項目,距離商用或許還有不遠的距離。杰夫·狄恩說,現在機器學習技術還未達到完美,有時出現劣質的轉錄文本、滑稽的翻譯結果或者錯誤識別的圖像,但相信在未來,機器學習可以變得更準確,越來越聰明。他預計,未來這項機器學習技術將用以幫助實現高質量的語音識別、實用型計算機視覺、攔截垃圾郵件,甚至應用于谷歌自動駕駛汽車。

  有外媒報道,曾有加拿大蒙特利爾大學的一位研究機器學習的教授 YoshuaBengio 在看了谷歌的演示后表示,谷歌的虛擬人腦技術讓人類離人工智能的終極目標又進了一步。“事實上,該系統的運行模式已經和哺乳動物甚至人類大腦的某些工作模式有些像了。Google 的這個虛擬人腦有點類似于哺乳動物大腦中一個叫做視覺皮層的部位,能夠通過視覺發現物體。” YoshuaBengio 說。

  這是否意味著出現了機器代替人腦的苗頭?杰夫·狄恩給出的答案是:“誰也不能預測未來 10~20 年機器學習的發展方向。”他提到,目前谷歌機器學習僅限于認知類的簡單工作,至于說幫助人們做規劃、協調工作關系等等,恐怕需要另外一些能力。

  從計算技術角度來說,神經網絡成本非常昂貴。杰夫·狄恩并沒有給出具體的數字,但介紹,通常機器學習領域使用的大多數網絡中只使用了 100 萬到 1000 萬個連接。但谷歌現在正在積極擴展系統,以訓練更大規模的模型。

  “雖然現在還沒有公認的方式將人工神經網絡和生物大腦進行對比,但為了讓大家大概地感覺到所謂的‘更大規模’,可以和人腦做一個很粗略的比較 —— 普通成人大腦大約有 100 萬億個連接。在這一領域,更大規模機器學習有著難以想象的發展空間。” 杰夫·狄恩說。

來自: 搜狐IT
 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!