一種新的對象識別算法:挑戰機器學習現狀
機器學習的基本原理是模型訓練。對于人類來說,可以從單一的樣例中學習到非常深刻的知識,例如變質的牛奶味道很差、火是熱的等,但機器卻需要更多的樣例,因為它們是基于統計學的原理進行學習。機器學習的過程主要依賴于數據。
不過,今天這種現象或許開始要改變了。本周,一篇人工智能 論文 登上了《科學》雜志的封面,為人類帶來了人工智能領域的一個重大突破,來自紐約大學的Brenden Lake、多倫多大學的Ruslan Salakhutdinov和麻省理工學院的JoshuaB.Tenenbaum共同開發了一個計算機系統:“只看一眼就會寫字”。
Salakhutdinov表示,人們一直試圖構建一個機器系統,讓其能夠像人類一樣,只需要很少的數據就能執行新的任務。“復制這些能力是一個非常令人期待的研究領域,其涉及到機器學習、統計學、計算機視覺和認知科學等學科”。大約十年前,Salakhutdinov與他的導師Geoffrey Hinton一起發表了一篇文章,題目為“深度神經網絡”。這個算法能夠從6000個樣本的數據中,學習到從0-9的10個書寫體字符概念的結構。而在Lake等人最新的成果中,引入了一個貝葉斯程序學習(Bayesian program learning, BPL)框架,它是一個能夠模仿人類思維方式的機器學習模型,即能夠從單一樣例中進行學習。這是一個“學會學習”(learns to learn)的模型。
這篇論文的第一作者Brenden Lake曾在Tenenbaum的團隊中獲得認知科學博士學位,如今他是紐約大學的博士后。根據Lake的介紹,這個模型能通過視覺圖靈測試。
論文指出,“只需要通過簡單的概念,人類就可以比機器學習到更豐富的表示,也可以將其用于更廣泛的功能,例如創造新的樣例,以及基于現有的類別創造出新的抽象類別。最好的機器分類器都不能執行這些功能”。
作者繼續表示,“目前的主要挑戰是解釋人類層次的概念學習的兩個方面”。“人類是如何從一個或幾個樣例中學習到新的概念的?人類又是如何學習這種抽象的、豐富的和靈活的表示的?”
機器學習模型是通過更多的數據而獲得提高的,但人類似乎能夠打破這個看似基本的原則。
根據論文所描述的,BPL能夠讓計算機對人類認知進行很好的模擬。傳統的機器學習方法需要大量的數據來進行訓練,而這種方法只需要一個粗略的模型,然后使用推理算法來分析案例,補充模型的細節。
研究者設計的學習方法到目前為止都只是針對具體的字符識別任務,例如世界字符表中的手寫字符。它的工作是按照算法指令生成一個給定字符的程序表示,算法指令是為了告訴用戶如何重新生成字符。結果是泛化的一種類別,按照相同的指令產生字母,不同的用戶可能會產生許多不同的變化,但它仍具有相同的基本標志。
文章中解釋,該模型能夠自然捕獲真實世界過程的抽象的“因果”結構,產生一種類別的各種樣例。該模型能夠使用先前產生的概念程序中的原語,不僅識別字母的新樣例,而且可以創造新的概念程序,例如新字母。
下面介紹模型的工作方式。給該算法一個以前從未見過的字符,讓它嘗試五次來解析字符,每一個都是一個新的方案(因此新的方案本身是算法生成的)。這些方案根據不同的概率每次創作不同的新的字符。正如你在視頻中看到的,結果與真實人類書寫的基本一致,因此,這項研究被打上了“人類層次概念學習”的標簽。
那么,該模型怎樣才能適用于一般的機器學習呢?
紐約大學的數據科學家告訴Motherboard,“現在的算法只適用于手寫文字,但我們確定了對模型性能很重要的三個核心原則,可能幫助在其他領域取得進展”。
第一個原則是“組合性”,如上所述,概念表示應該由簡單的基元構建而成。第二原則是“因果性”,模型表征了真實世界中的對象生成的抽象因果結構。最后一個,是“學會學習”,過去的概念有助于學習新的概念。
Lake說到,“這些原則可能有助于解釋人類能夠快速學習和使用其他類型概念的原因”。“我們尤其對一些學習新的口頭語和學習新手勢的應用感興趣,當你聽到一個人說過“潘基文”的名字,你基本上就懂了,并且能夠識別其他人說起這個名字,同時自己也可以近似說出這個名字。同樣的情況可以適用于手勢。
多倫多大學和谷歌的人工智能先驅Geoffrey Hinton說這個研究“令人印象非常深刻”。他說,這個模型能通過視覺圖靈測試,這很重要,是一個不錯的成就。Hinton是深度學習的奠基者。他近年來在深度學習方面取得了舉世矚目的成就,其研究成果被廣泛應用在許多領域,例如語音翻譯、圖像識別以及谷歌的圖像搜索和非死book的人臉識別。
感謝董志南對本文的審校。
給InfoQ中文站投稿或者參與內容翻譯工作,請郵件至editors@cn.infoq.com。也歡迎大家通過新浪微博(@InfoQ,@丁曉昀),微信(微信號: InfoQChina )關注我們,并與我們的編輯和其他讀者朋友交流(歡迎加入InfoQ讀者交流群 (已滿),InfoQ讀者交流群(#2)
)。
來自: http://www.infoq.com/cn/news/2015/12/Object-machine-learning