尋找生命的基礎算法
編者注: 為什么說 “機器學習” 這個概念里面 “機器” 是多余的? 有沒有主宰一切的主算法 ? 圖靈獎獲得者 Leslie Valiant 在接受 QUANTA 雜志采訪時回答了上述問題 。
對于計算機科學家 Leslie Valiant 來說,“機器學習” 這個詞是累贅的。在他看來,姍姍學步的小孩笨手笨腳地玩橡皮球是學習,深度學習網絡對貓的圖片分類也是學習,把后面的系統叫做 “機器” 只是人為制造出來的區別。
哈佛大學的計算機科學家 Valiant 很難算是唯一一位認為人腦和計算機的能力基本相同的科學家。但他是最早正式提出這兩者可能關系的人之一:1984年,他的 “大概近似正確(Probably Approximately Correct,PAC)” 模型在數學上定義了可被稱為能 “學習” 信息的機械式組織的條件。因為這個模型促進了計算學習理論的發展,Valiant 獲得了計算機界的諾貝爾獎—圖靈獎。
Valiant 的概念突破并沒有止步于此。在他 2013年 出版的新書《Probably Approximately Correct》中,Valiant 把生物進化也納入到他的 PAC 學習框架里面。
他把某個算法概念拓展成了 “ecorithm(生態法則)”,這是一種學習算法,其特別之處在于它可以 “運行” 在任何能與物理環境進行交互的系統上。按說算法應該是運用到計算機上的,但 ecorithm 卻可以應用到生物組織或者整個物種上。這一概念給個體學習方法與整個生態體系的進化在計算上劃上了等號。無論是哪一種情況,ecorithm 都用機械論的方法描述了適應性的行為。
Valiant 自己的目標是尋找 “學習與進化的數學定義,這種定義應該能夠涉及信息進入系統的所有方法。” 如果成功,Valiant 半帶玩笑的口吻說,那它就是 “萬有理論(theory of everything)” 了。但他的研究意義顯然非常重大—這相當于把生命科學與計算機科學的界限給模糊了。此外,我們對 “學習” 和 “智能” 的直觀定義也將擴展到非生物體和非個體上。“群體智慧” 將不再只是修辭手法而已。
針對 Valiant 化解生物學與計算之別以及進化與學習之別的努力,Quanta 雜志對這位計算大師進行了采訪。下面是采訪摘錄的編譯。
你是如何想出 “大概近似正確” 學習這個主意的?
LESLIE VALIANT:我屬于理論計算機科學派,尤其是計算復雜性理論,不過我對人工智能也挺感興趣。我的第一個問題是:人工智能的哪個方面能夠變成定量理論?很快我就確定這一定是學習。
我當時開始做的時候(1980年 代),大家已經開始研究機器學習了,但大家對 “學習” 是個什么東西還沒有達成一致。實際上,理論計算機科學界對學習這個東西完全是質疑的,認為它永遠都沒有機會被當作科學看待。
但另一方面,學習是一種可充分復制的現象—就像蘋果總會掉到地上一樣。每一天,全世界的兒童都會學習成千上萬個新詞。這是一種大規模的現象,必須有量化的解釋。
所以我認為學習應該要有某種形式的理論支撐。既然統計推斷已經存在了,我的下一個問題是:為什么統計不足以解釋人工智能?所以我的研究起點是:學習必須是某種可統計的東西,但同時還應該是可計算的。我需要某種理論能把計算和統計結合起來,對這一現象做出解釋。
那么學習是什么?它跟計算(computing 或 calculating)有何不同?
學習是計算(calculating)的一類,但它的目標是在一個沒有提前精確建模好的世界里表現良好。學習算法會對世界進行觀察,然后利用該信息來確定做什么并對自己的決定進行評估。我在書中提到的一個觀點是,個體所掌握的所有知識要么是通過學習獲得的,要么是通過進化過程獲得的,只能有這兩種可能。如果是這樣的話,那么個體學習和進化過程應該有一套統一的理論來解釋它們。
因此你最終得出了 “ecorithm(生態算法)” 的概念。Ecorithm 是什么?它跟算法(algorithm)又有什么不同?
Ecorithm 也是算法,但它的執行要利用輸入來進行評估,而這種輸入是在一個相當不受控和不可預測的世界里獲得的。而且它的目標是在同樣復雜的世界里執行得好。你可以把算法看作是在計算機里面運行的某個東西,但它在生物有機體身上也很容易執行。不過無論是哪一種情況,ecorithm 都是存活于外部世界里,并且要跟那個世界發生交互的。
這么說 ecorithm 是要消除我們過去對 “機器學習” 的那種錯誤直覺啰?那種認同 “機器學習” 與 “非機器學習” 有著根本不同的觀點是錯誤的?
是的,當然。從科學上來說,如果我們的大腦進行計算,然后如果我們能夠識別出產生那些計算的算法的話,我們就能在機器上面模仿它們,而 “人工智能” 和 “智能” 就變成一樣了。這個觀點早在半個世紀以前就提出來了。但是實踐的難度在于確定人類大腦運轉的這些計算究竟是什么。機器學習證明是繞開這種困難的有效方式。
對于機器來說,那些我們在進化過程或者從小趴在地上接觸和感受環境時掌握的行為所涉及的算法,是其中最大的挑戰之一。我們用這些方法所所得的知識是沒辦法書寫出來的。比方說,如果我把一個裝滿熱咖啡的紙杯給擠扁了,我們都知道會發生什么,但是這種信息在互聯網上很難找到。但如果互聯網上有這種信息的話,那讓機器學習這一信息就容易多了。
對那些行為我們早已熟知的系統(比如太陽能系統或者晶體)的算法仿真是不是也可以稱為 “學習”?
我不會把那些系統看作是學習。我認為學習者需要有某種最低限度的計算性活動才行,如果發生了任何學習行為,這種行為必須能夠使得該系統更有效才行。直到 10、20年 前,機器學習才開始成為某種計算機可以執行的給人留下深刻印象的東西。除了生物系統以外,在這個宇宙中目前尚未有跡象表明其他東西具備學習能力。
學習理論如何能夠應用到生物進化這樣的現象上?
生物學是以蛋白質表達網絡為基礎的,隨著進化的進行,這些網絡也得到了改良。PAC 學習模型給那些網絡施加了一些邏輯限制,限制了這些網絡在經歷達爾文進化時會發生什么事情,從而導致那些改良的產生。如果我們從生物身上收集更多的觀察,然后在這個 PAC 式的學習框架里面進行分析的話,我們就應該能夠找出生物進化成功的方式和原因,而這可以讓我們對進化的理解更加具體并且更具預測性。
我們的進展如何?
在生物行為方面我們還沒有解決所面臨的每一個問題,因為我們還沒有找到那些特別的、生物用來產生這些現象的 ecorithm(生態算法)。所以我認為目前這一框架設定的問題是合適的,只是我們還不知道答案。我認為通過生物學家和計算機科學家之間的通力合作,這些答案是可以獲得的。我們已經知道要找什么了。我們要找的是遵循生物學能夠且的確支持的達爾文約束的學習算法。這種算法將可以解釋迄今為止這個星球上所發生的導致進化發生的所有事情。
假設明天我們就發現了那個特別的支撐生物進化和學習的生態算法(ecorithm)。如果我們掌握了這種精確的知識后,我們能夠理解哪些過去無法理解的事情呢?我們有能夠做哪些過去無法做的事情呢?
嗯,首先我們能夠理解我們是從哪兒來的。但另一種外推會把更多的心理學內容帶進計算可理解的領域。所以對人性具備更多的理解會是另一個成果,如果這一程序能夠成果執行下去的話。
你的意思是說計算機可以可靠地預測人會做什么事情?
這屬于非常極端的場景。預測你下一個小時究竟要做什么我需要哪些數據呢?根據物理科學我們知道人是由原子構成的,我們也了解了大量的原子屬性,從某種理論意義上來說,我們能夠預測一組原子能夠做什么。但這種觀點在解釋人類行為方面走不了多遠,因為人類行為是太多原子極端復雜的一種表現。我是說,如果有人能夠對大腦的運行機制做出高級的計算解釋,那么我們離對人類行為做出解釋(這種解釋應該能夠與我們對其他物理系統的機械化理解相匹敵)這一目標就會更近一點了。原子的行為與人類的行為相去甚遠,但如果我們能夠理解大腦使用的學習算法,那么這種算法就能提供與人類行為相近得多的機械論概念。而它們給出的你要做什么、為什么要做的解釋就能變得更加可信和可預測。
如果支配著進化和學習的生態算法是不可學習的怎么辦?
這個問題的邏輯可能性是存在的,但我并不認為這種情況會出現。相反,我覺得這種算法應該是相當具體的,并且理解起來也應該相當容易。對于數學上的不解之謎我們一樣可以提出同樣的問題。你相信這些問題有解嗎?這些解是大家可以理解的嗎?還是說會超出人類的理解范疇?對這個領域我非常有信心—否則我就不會去追尋答案了。我認為自然使用的算法是有形的、可理解的,是不需要我們不具備的直覺才能理解的。
許多杰出的科學家對有可能出現我們不能控制的人工 “超智” 表達了自己的擔憂。如果你的生態算法理論是正確的,并且智能的確通過學習算法與環境的交互而出現的話,這是否意味著我們應該像對 AI 系統本身的編程一樣對部署 AI 的環境保持警惕?
如果你設計的智能系統是從環境學習的話,那就不知道了—在一些環境下系統表現出的行為可能是你根本就無法預見的,而這種行為可能是有害的。所以就這一點來說你是對的。但一般而言我對超智可能會導致人類歷史滅絕的說法不是太擔心。我認為智能是由具體的、機械化的、并且最終是可理解的進程構成的。我們會理解我們放進機器中的智能,就像我們對爆炸物的物理機制的理解一樣—也就是說,理解到足以讓它們的行為可預測,通常不會導致非故意破壞的產生。所以我不是很擔心,我覺得人工智能跟其他現有的強大技術沒什么兩樣。它跟其他技術一樣也是有科學依據的。
本文編譯自: quantamagazine.org ,如若轉載,請注明出處:http://36kr.com/p/5043199.html
“看完這篇還不夠?如果你也在創業,并且希望自己的項目被報道,請戳這里告訴我們!”
來自: http://36kr.com/p/5043199.html