反向工程破解大腦算法,讓機器讓人類一樣學習

jopen 8年前發布 | 20K 次閱讀 算法 逆向工程

卡耐基梅隆大學的Sandra Kuhlman使用熒光成像技術獲得的神經網絡圖像,其中可以看到單個大腦神經元細胞。

反向工程破解大腦算法,讓機器讓人類一樣學習
CMU團隊使用熒光成像技術標記出的單個神經元

</figure>

為了提高效率以及對自身的理解,我們人類在開發更強大的計算機和打造自動化世界上進行了很大的投入。盡管現在計算機已經可以毫不停頓地高速執行大量計算,但和自然界中的生物計算機(大腦)比起來,仍舊還是望塵莫及。但人類從未停止過對大自然般造化之力的追求,卡內基梅隆大學(CMU)正在進行的一項計算機科學研究有望加深我們對生物的理解,并以此促進類大腦算法的開發。

卡內基梅隆大學計算機科學系和認知神經基礎中心(CNBC,卡耐基梅隆大學與匹茲堡大學之間的一個合作研究項目)教授 Tai-Sing Lee 領頭的研究項目將會嘗試使用反向工程研究大腦,并希望能夠以此揭示大腦的學習算法,將其應用于推進機器學習算法。按照計劃,這一研究項目將持續五年,共耗資約1200萬美元。這些資金來自于 高級情報研究計劃署(IARPA) 大腦皮層網絡機器智能(MICrONS)計劃 ;該項目正在幫助推動美國總統奧巴馬的 腦計劃(BRAIN Initiative) 徹底刷新我們對人類大腦的理解。

Lee說:「MICrONS在設計和范圍上與首次測繪排序人類基因的人類基因組計劃(Human Genome Project)相似。它很有可能將具有長期的影響并有望徹底改變神經科學和人工智能。」

除了生物學家在努力揭示大腦的秘密之外,計算機科學家也一直在忙于改進機器學習,并在近幾十年內取得了顯著的進步。

機器學習的主要目標是使用計算機破譯數據中的模式并生成模型,然后再使用該模型來預測新數據;與此同時,模型還會與新數據共同進化使之變得更為穩健。機器學習算法為近年來的許多進步做出了貢獻,包括基因組分析、大規模大數據應用和自動駕駛汽車。

新技術的發展讓收集關于大腦活動的海量數據成為可能,更重要的是,新技術讓我們可以對這些數據進行分析并得出重要的結論。Lee領導的項目的一個主要目標是創建一個代表神經回路的大型數據庫。為了實現這一目標,Lee所領導的團隊將與另一支 Wyss生物啟發工程研究所 (Wyss Institute for Biologically Inspired Engineering)的MICrONS團隊建立合作,該團隊的領頭人是哈佛醫學院遺傳學教授George Church,目前正與來自冷泉港實驗室、麻省理工學院和哥倫比亞大學的研究者合作開發用于重建卡耐基梅隆大學所記錄的全部神經元回路的革命性技術。這個數據庫與另外兩個其它MICrONS團隊貢獻的數據庫的規模將是前所未有的;建成后還將開放給世界上其它地方的研究者用于研究。而Lee也將和卡耐基梅隆與CNBC生物科學助理教授Sandra Kuhlman、約翰霍普金斯大學與彭博公司的特聘認知科學教授Alan Yuille對其中的數據進行分析。

在這個MICrONS項目中,相關研究人員除了可以提高對大腦計算原理的認識,還能使用這些大型數據庫評估一些計算和學習模型,并利用反向工程處理這些數據以打造更好的計算機學習和模式識別算法。

而目前已經在機器學習中得到應用的技術是神經網絡:其中的算法基于類似動物神經元的可互相分享數據并作出計算的簡單計算單元。神經網絡在1990年代達到過一次研究頂峰,近年來隨著計算機算力與數據集的增長,研究熱度又再次回升。并在一些不同的領域產出了一些有趣的應用,包括面部識別、語音和手寫文字識別、自動駕駛汽車的自動決策、自動交易和預防金融詐騙等。

Lee說:「但今天的神經網絡實質上使用的是1980年代初期開發的算法。它們是很強大,但它們仍然無法達到人腦算法那樣的高效和強大。比如說學習識別一個物體,計算機可能首先需要成千上萬張帶有標簽的樣本,還需要進行監督式的教導才行;而人類則只需少量樣本且可能不需要監督。」

人工神經網絡的信息處理是單向的:從輸入節點到輸出節點。而大腦的工作方式則很不相同。人類大腦由許多神經元構成,這些小單元可以通過巨大的電脈沖網絡互相發送信息,這些信息調控了所有大腦所控制的身體功能,包括理解場景和肢體運動等。通過最近的研究數據可以發現,大腦中的神經元是高度互連的,每一步處理過程都可能產生反饋。盡管近幾十年來生物學家已經在相關研究上取得了豐碩的成果,但到目前為止,科學家還并沒有完全理解神經元的工作機制。而一旦理解其中的機制,我們可能就將有能力打造出更有能力且更近似于人腦的神經網絡。

為了更好地理解生物神經網絡和它們的反饋回路,Kuhlman將使用一種被稱為「雙光子鈣成像顯微鏡(2-photon calcium imaging microscopy)」的技術來記錄上萬個小鼠神經元處理視覺信息時所產生的信號。記錄下的數據將用于幫助打造一個互連神經元模型。她指出,幾年前這樣的成果還無法實現,因為當時的觀測精度有限,幾個在一起的神經元會被同時觀測到,而且單次實驗時也只能觀測到幾個或十幾個神經元。

「通過將分子傳感器與光學方法的復雜組合整合起來檢測神經活動,現在就算不能監控全部神經元,也有可能可以實時追蹤一個大腦區域內神經元的大部分神經動態。」Kuhlman說,「因此我們可以得到一個巨大的數據集,幫助我們詳細認識視覺皮層某個區域中神經元的行為。」

科學家認為如果我們能以某種方式了解大腦,那么我們就能知道如何復制它,而我們的機器也將有能力靠自己學習。(一個項目同時實現這兩個目標非常符合卡內基梅隆大學的跨學科文化。)

研究人員希望使用這個大規模數據集解開神經網絡的復雜難題。他們的目標是將獲得的新知識應用到機器學習算法上,使他們可以使用少得多的樣本就能開發出模型。這對未來具有重要的意義。Lee說:「希望這些知識可用以促進新一代機器學習算法的開發,使人工智能機器可以在不需要監督的壞境下通過少量樣本進行學習,而這正是人類智能的標志。」

「從這些大規模數據中提取大腦學習和推理的秘密算法以推動機器學習的發展是頗具野心的,可能是這個項目中最不能明確的一部分。」卡耐基梅隆大學計算機科學學院院長Andrew Moore說,「這就相當于登月計劃,但卡耐基梅隆是做這件事最好的地方,因為我們在人工智能方面有非常強大的傳統和社區。我們還有一個與認知神經基礎中心和大學的BrainHub計劃有合作的強大的理論和實驗神經科學家社區。」( BrainHub 是一個神經科學研究倡議,該倡議的目的是將大學的生物學、計算機科學、心理學、統計學與工程學結合起來研究理解大腦的結構和行為如何產生復雜行為。)

紐約大學數據科學中心主任Yann LeCun在卡內基梅隆大學的一場新聞發布會上對此評論說:「人工智能在不斷進步中從失敗走向失敗,但這次可能又是一次飛躍。」

內容來源 thetartancmu ,機器之心吳攀編譯。

來自: http://www.almosthuman.cn/2016/02/20/edxxv/

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!