批評深度學習的Gary Marcus能讓人工智能更接近人類嗎?

jopen 8年前發布 | 29K 次閱讀 深度學習
 

導讀:在紐約大學,Yann LuCun等學者將深度學習帶上巔峰的同時,Gary Marcus,Brenden Lake,Ned Block等學者已為后深度學習時代的人工智能打下堅實的地基。期待后深度學習時代的人工智能從大腦、意識和嬰兒研究中汲取靈感,創造新的算法與架構滿足 深度學習所釋放的對人工智能的廣泛要求。

——Bragi Lovetrue(瑞士人工智能公司Demiurge Technologies聯合創始人

像任何一個自豪的父親一樣,Gary Marcus非常樂意談論他兩歲兒子的最新「成果」。但更不尋常的是,他相信蹣跚幼童的學習和推理方式中蘊含著讓機器更加智能的秘密。

現年45歲的Marcus是紐約大學心理學教授,同時也是創業公司Geometric Intelligence創始人。Marcus坐在曼哈頓一個熙熙攘攘的創業孵化器辦公室里,向我描述他兒子有多么聰明機智。有一次,小孩在汽車后座上看 到一個數字「11」,由于他之前知道兩個相同數字組成的新數字讀音有點類似,比如「33」讀作「thirty-three」,于是這個兩歲的小家伙問道: 「11」是不是讀「onety-one」?

Marcus微笑的解釋說:「他在推理把數字放在一起的讀音規則。不過,他的推理過于泛化了,于是他犯了一個錯誤,但這是一個非常復雜的錯誤。」

與絕大多數研究人工智能的科學家相比,Marcus有獨特的思維角度。他曾經花費多年時間研究人類思維的工作原理以及兒童學習語音、音感等新技能 的方式方法。這使他相信,如果研究者要創造真正復雜的人工智能——一種可快速學習周遭世界的智能,那么他們必須從兒童學習新概念并進行概括的方法中找尋靈 感。這也成為他創辦這家新公司的重要動力之一,一年前他離開紐約大學,隨后成立了這家公司。Geometric Intelligence 計劃利用這種激進的機器學習路徑來研發一種用于人工智能的新算法,從而使機器通過一種全新的、更好的方式進行學習。

如今,包括谷歌、百度在內的幾乎所有公司都在致力于將人工智能商業化,這些公司的研究重點都是在深度學習,大腦中的神經回路在接收到新信息會發生 變化,深度學習算法就是對這種變化方式進行粗略建模。的確,深度學習在最近幾年帶來了驚人成果,尤其是更多的數據和更加強大的計算能力帶來了基礎計算的規 模化增長。深度學習在人臉識別、語音識別的準確度上都已經達到甚至超過了人類。谷歌、非死book等科技巨頭正在將深度學習用在幾乎每一個有助于在大 量數據中識別模式的任務中。

但是,基于人腦模型的深度學習太過簡單嗎?Marcus斷定,計算機科學家由于忽略了人類思維的精妙而正在錯失一個巨大的機會。不管是發表作品和 評論,還是公開露面,Marcus都以一個嚴厲的深度學習批評者身份亮相。盡管偶爾有些粗魯的表達,但Marcus還是從另外一個角度提供了有價值的觀 點。他指出,這些深度學習系統在學習知識時需要接收海量數據,當研究者們試圖開發一個可以與人類自然交談的機器時,他需要讓機器接受人類海量對話內容的文 本轉錄。這種方法的確可以讓機器學會一些簡單交談,但認知科學的研究顯示,這并非人類大腦獲取語言的方式。

與之相反的是,一個兩歲的兒童可以通過推斷和歸納來學習,即使還不完美,但也遠比機器復雜。很顯然,人類大腦在處理海量數據方面的能力更強大,大 腦也能從相對少量的數據中獲取更加深度的抽象概念。即便讓機器擁有一些人類大腦獲取抽象概念的基本能力都會是一個重要成就。屆時,無人駕駛汽車就沒有必要 通過行駛幾百萬英里來學習如何應對道路的新情況,機器人也能夠識別和拿來此前只「見」過一兩次的藥物。換句話說,這些機器的思考和行動方式更接近人類。

Marcus的頭發略顯凌亂,但他看起來非常適合企業家這個新角色。在他的公司里,一群程序員在昂貴的配備強大圖形處理器的工作站前奮力工作。曾經,Marcus 想要闡述一個大腦工作方式的要點時,一度誤將一支放錯位置的飛鏢當成白板筆。

Marcus激動時語速會很快,幽默感十足,并時常帶有淘氣的笑容。由于擔心谷歌等大公司可能會學到背后的關鍵見解從而掌握優勢,他拒絕透露公司 在研產品和應用的更多細節。他只是粗略地指出,公司已經開發出的算法能夠從相對較小的數據集中進行學習,甚至能夠進行推斷和歸納。Marcus表示,他們 選取了一些深度學習方法非常擅長的任務對他們的算法進行了測試,結果證明,在某些情況下,他們算法的表現要明顯優于深度學習。對此,他解釋道:「我們知道 一些大腦本應該表現出來的特性,在某種意義上,我們是在從這些特性中進行逆向工程。」

青年才俊

Marcus出生在巴爾的摩,高中時讀了認知科學家Douglas Hofstadter(侯世達)和哲學家Daniel Dennett合編的關于意識的文集《 The Mind’I》,同時也讀了侯世達關于機器和心靈的著作《哥德爾、艾舍爾、巴赫》,從此他開始對「心智」變得著迷。大約在同一時間,他寫了一個可以將拉丁 語翻譯成英語的程序。這項工作的難點讓他意識到,如果我們要在機器中重新創造智能,就必須更加理解那些隱藏于人類思維中的運作現象。

Marcus的翻譯程序并不怎么實用,但這個程序還是說服了罕布什爾學院,讓他在未到年齡時成為該校的本科生。這座崇尚自由教育的小型學院位于馬薩諸塞州的艾摩斯特市,學院鼓勵學生們設計自己的學位項目。Marcus決定將自己的時間花在研究人類認知的這個謎題上。

在人工智能領域,20世紀80年代中期是一個有趣的時期。那時的人工智能分化為兩個陣營,其中一個希望通過復制大腦的基本生物狀態來創造智能機 器,而另一陣營的目標則是用傳統計算機和軟件來模擬更高級的認知功能。早期的人工智能研究都是基于第二種方法,使用的是用來處理邏輯和符號表示的編程語 言。一個經典的例子與鳥有關,「鳥能飛翔」這個事實可以編碼為一段知識。接著,如果你告訴計算機「歐椋鳥是一種鳥」,它就會推斷出歐椋鳥也可以飛翔。當時 啟動了許多重大項目,目標就是將人類的知識編碼成巨大的數據庫,希望能從中涌現出某種復雜的智能。

盡管取得了一些進步,但越來越多的證據表明這個方法過于復雜和笨重,難以實現。規則總是存有例外,例如,并不是所有鳥都會飛。且不說企鵝幾乎完全 被局限在地面上,籠中之鳥和斷翼之鳥也無法展翅高飛。把所有的例外都編碼到規則中實在太過復雜,根本無法實現。學習這些例外對人來說很容易,但對計算機來 說卻很困難。(當然,還有一些例外對人來說也容易引起困惑,例如英語中的11是eleven,而不是onety-one。)

批評深度學習的Gary Marcus能讓人工智能更接近人類嗎?
Gary Marcus

在Marcus準備進入罕布什爾學院學習時,一些心理學家想出了一個方法,威脅要將人工智能完全顛覆。早在20世紀40年代,Donald Hebb提出了關于大腦中神經元如何學習識別一個輸入的理論。他的研究表明,重復的神經元放電可能會加強它們之間的聯系,從而提高遇到同樣輸入時再次放電 的可能性。一些研究者采用類似的設計思路建造了計算機。但是,這種所謂的神經網絡效能很低,直到1986年,一組研究者發現了提高神經網絡學習能力的方 法。這些研究者還展示了神經網絡可以用來完成許多不同的事情,從視覺數據中的模式識別到學習英語動詞的過去時態。用足夠的數據樣本來訓練這些網絡,它們就 能形成完成某些任務時所需要的連接。

這些研究者把他們的方法稱為「聯結主義」(connectionism),并聲稱只要有足夠大的神經網絡,就能重現智能。盡管他們的想法并沒有立刻顛覆業界,但最終孵化出了今天大家耳熟能詳的深度學習。

在聯結主義興起之時,Marcus正在決定自己要去哪里讀研究生。他參加了著名認知科學家、時任MIT教授的Steven Pinker的講座。Pinker講到了兒童學習和使用動詞的方式。他認為,與純粹聯結主義者的預期不同,兒童學習動詞過去時態的時候,似乎并不是純粹記 住一些例子再推而廣之到相似的例子。Pinker展示的證據表明兒童很快能察覺出語言規則并加以概括推廣。他和其他人都相信,從本質上說,進化塑造了人腦 中的神經網絡,為更加復雜的智能提供了必要工具。

19歲時,Marcus加入了Pinker在MIT的實驗室。Pinker回憶起他是一個早熟的學生,他說:「我分配給他一個項目,在一個小數據 集中分析一個簡單的是非假說,這個數據集是由3個兒童的語音錄音組成。幾天后,他完成了一個基于25名兒童的詳盡分析,測試了6種假說,為一項重要的研究 專著打下了基礎。」

Marcus在研究生期間收集了更多證據,來支持Pinker關于學習的理論,并形成了自己的理念。他率先將大量認知研究數據電子化,研究了幾千 份兒童語音的錄音資料來尋找他們的錯誤,例如將「broke」和「went」誤說為「breaked」和「goed」。這似乎證實了兒童掌握語法規則后會 將其運用在新詞上,并通過死記硬背來學習那些不符合規則的例外情況。

基于該項研究,Marcus開始質疑聯結主義者們認為智能會從大型神經網絡中自動涌現的想法,他開始將注意力集中在深度學習的局限性上。一個深度 學習系統縱然可以在被訓練后從一張圖片或一段視頻中識別出某種鳥類,并找出能飛的鳥和不能飛的鳥之間的區別。但是它需要看幾百萬張示范圖才能做到這一點, 并且系統也不懂為什么有的鳥類不會飛。

Marcus對兒童的研究讓他得出一個重要結論。2001年,在《代數的頭腦》(The Algebraic Mind)一書中,他論證說,發育中的人類思維會同時從以下兩個方面進行學習,一是案例,二是從已學到的東西中概括出規則。也就是說,對某種特定的任務, 大腦會使用與深度學習類似的系統,但它也會存儲和運用關于世界運轉的規則,以便從少量的經驗中得出有用的結論。這并不意味著幾何智能是在試圖模擬大腦的模 式。Marcus說:「在一個理想的世界中,我們能知道兒童是如何做到的,大腦回路是如何參與的,以及他們所進行的計算。但是神經科學依然是一團迷霧。」 實際上,他暗示說,他的同行們正在使用摸彩袋的方法(包括一些與深度學習「相容」的方法)來試圖重建人類的學習過程。

常識(Common sense)

Geometric Intelligence 公司的工作非常值得關注,毫無疑問,從認知科學與神經科學交叉起來進而衍生出一些新想法將對未來的人工智能研究至關重要。然而,在與Marcus 會面之后,我感覺自己就像一個試圖去理解一些并不熟悉數字的孩子。這些是如何聯系在一起的?我找到了Marcus的合作伙伴,讓他給我解釋一下這家公司的 謎題。

Zoubin Ghahramani是Geometric Intelligence公司另一位聯合創始人,劍橋大學信息工程教授。Zoubin Ghahramani先后在前蘇聯和伊朗生活,后來相繼搬到西班牙和美國。他恰巧與Marcus同年同月同日生,但比Marcus晚一年來到MIT。

Ghahramani側重于通過概率讓機器變得更聰明。雖然其背后的數學原理很復雜,但采用該方法的原因很簡單,概率提供了一種應對不確定性和不 完備信息的方法。「能飛的鳥」也許是個不錯的案例。一個基于概率的系統可以得出「一只鳥會飛」概念的很高的可能性。接下來,當系統學習到鴕鳥也是鳥類時, 也會假設鴕鳥很可能會飛。但其他信息也會改變上述假設,比如說「一只成年鴕鳥的重量通常超過200磅」,從而不斷降低「鴕鳥會飛」的概率,直到接近為零。 這種靈活的方法可以灌輸給機器一些像是常識的天然形式的東西,這也是人類智能的重要基本屬性。

我與位于劍橋的Ghahramani通過Skype交談,Ghahramani 暗示了他和Marcus所看重的一項特殊應用:訓練機器人應對復雜環境。Ghahramani 認為,在目前的機器人研究領域,讓機器人擁有經驗需要付出非常昂貴的代價。「如果你希望讓機器人學會走路,或者讓汽車學會自動駕駛,那么通過數百萬次的跌 倒、碰撞甚至車禍事故等案例去訓練它是無法實現的,這行不通。」

鑒于Geometric Intelligence 公司在概率算法和其他技術的研究可以與深度學習兼容,未來并不排除谷歌或非死book將其收購的可能性,從而將該公司的技術添加到自己的人工智能產品 組合中。盡管Marcus對連結主義和深度學習熱潮一直持批評態度,但我能預感到,他會對最終被收購的結局非常滿意。

即便最后被巨頭收購,但­如果Marcus能展示出這套最不可思議的學習系統(人類思維)是人工智能未來的關鍵,他的研究將會產生重大意義。 Marcus還分享另一個他兒子聰明伶俐的案例:「我妻子問他:『今天你的哪一位動物朋友會去學校?』他回答:『兔寶寶,因為熊和鴨嘴獸正在吃飯。』然 后,我的妻子去他的房間里一看,果然,那些動物玩偶正趴在桌子上『吃飯』。」

Marcus很奇怪他兩歲的兒子能夠推理出涉及人類行為的相關規則——他能意識到「你要么會去學校,要么在做其他事情(吃飯)」——隨著他對語言 運作方式的理解更加深入,他能構建出一個全新的句子。短暫停頓后,Marcus微笑地補充道:「現在有哪些AI系統可以做到這些?給我看看?」

本文選自MIT technologyreview,作者Will Knight,機器之心編譯出品,參與者:趙云峰、汪汪、趙賽坡。

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!