人工智能的學習能力將更加接近人類,只是還有一些不確定性
在人類的努力下,人工智能的學習能力正在不斷發展,但與人類相比仍有較大差距,這種差距會隨著人類技術的不斷進步而縮小至一個較小的范圍嗎?
美國《連線》雜志網絡版對此問題進行了探討,為了解決神經網絡存在的各種缺陷,相關企業正在利用高斯過程和貝葉斯優化等數學知識改進人工智能技術,利用更少的數據實現與人類更加接近的學習能力。
神經網絡在硅谷紅得發紫,許多互聯網服務都融合了各式各樣的人工智能技術。然而,雖然這種技術已經能從你保存在網上的照片里辨認出貓咪,但研究人員深知,神經網絡仍然存在很多瑕疵。因此,有人想知道,究竟能否利用這些形態識別系統設計出更先進、更可靠的人工智能模式。
神經網絡能夠通過分析龐大的數據學會各種任務,非死book 利用這種技術來識別人臉,微軟則將其用于翻譯服務,谷歌也把其整合在網絡搜索中。它們甚至開始幫助聊天機器人學習對話的藝術。而在無人駕駛汽車和其他自動化機器的發展過程中,這種技術同樣扮演了至關重要的角色。
然而,由于必須借助添加了標簽的海量技術才能發揮作用,所以神經網絡并不適合所有任務。不僅如此,人工智能研究人員對于神經網絡制定具體決策的原因也并不十分了解。所以,從很多方面來看,這其實就像是一個個的黑盒子。這種不透明性會引發很多嚴重問題:如果無人駕駛汽車撞到某人,應該如何判斷背后的原因?
“深度學習最近獲得了很多關注,這是理所應當的。”卡內基梅隆大學計算機科學教授托馬斯·桑德霍爾姆(Tuomas Sandholm)說,他曾經參與開發了 Libratus,這套人工智能系統并未使用神經網絡,但最近卻在撲克比賽中超過了最優秀的人類選手。“但深度學習不會向你保證任何事情。”
事實的確如此,但由于神經網絡存在這些明顯缺陷,當今世界規模最大的一批科技公司都在拓寬其思考人工智能的方式,這一點從最近的招聘、收購和研發項目中便可看出端倪,甚至有很多創業公司也在向著相同的方向發展。
你可以將此視作貝葉斯統計學的崛起,這一學科的研究人員希望通過科學方法來使用人工智能技術——首先制定一個假設,然后根據數據更新這一假設——而不是像神經網絡一樣單純利用數據得出結論。貝葉斯統計學家希望通過各種方式應對不確定性,為現有模型增加新證據,并完成一些神經網絡并不擅長的任務。
與神經網絡一樣,貝葉斯統計方法可以從數據中了解各種信息,但這種機器學習模式的實施過程卻有所不同。“我們感興趣的是自動完成這種科學方法。”人工智能創業公司 Gamalon 創始人本·維格達(Ben Vigoda)說,該公司希望通過一種名為概率編程的技術拓展這一方向。
這再次提醒我們,神經網絡的快速崛起帶動了其他許多能夠提升機器智能水平的技術發展,包括強化學習和進化計算。除此之外,機器也可以通過很多方式展開“學習”。
神秘技術
當蓋里·馬庫斯(Gary Marcus)去年 12 月將他的那家擁有 15 名員工的創業公司賣給 Uber 時,他開發了一種新型人工智能技術。
他的公司當時名叫 Geometric Intelligence,雖然規模不大,但卻目光遠大。這位 47 歲的紐約大學心理學教授稱,他和其他研究人員當時正在開發能像人類一樣,通過少量數據學習任務的系統——這種模式有望超過深度學習網絡。
馬庫斯認為,如果想要開發能夠完全依靠自己與人類對話的設備,或者能夠在公開道路上行駛的汽車,小數據系統至關重要。“如果想用深度學習的粗礦方法來解決語言和無人駕駛汽車領域的一些問題,你將永遠無法獲得足夠的數據。”他在 Uber 去年 12 月收購 Geometric Intelligence 時說。畢竟,不可能為了學會躲避事故而在繁忙的道路上通過撞車來收集數據。“這些數據要么買不到,要么不存在。”
馬庫斯和他的創業伙伴、劍橋大學信息工程教授左斌·加哈拉瑪尼(Zuobin Ghahramani)仍然不肯透露他們正在開發的具體技術。科技行業的這種保密模式往往會創造神秘氛圍,人工智能尤其如此。但加哈拉瑪尼也是一名貝葉斯統計學家。他擅長一種名為高斯過程的統計模型,這有可能在他和馬庫斯正在開發的產品中發揮重要作用。
高斯過程
從某種意義上講,高斯過程是為特定問題尋找最優解決方案的一種方法。作為貝葉斯優化的基礎,高斯過程已經幫助一些網站決定應該展示哪些廣告,或者應該把主頁設計成什么樣子。Uber 正在聘請擅長高斯過程的學術人士來改進其專車服務。而谷歌也利用高斯過程幫助其控制該公司的高空互聯網氣球。
從本質上講,高斯過程是判斷不確定性的一種好方法。“了解你不知道的事情是件好事。”愛丁堡大學人工智能研究員克里斯·威廉姆斯(Chris Williams)說,他曾經參與撰寫了關于高斯過程和人工智能的重要書籍,“滿懷信心地犯下錯誤是你所能做的最糟糕的事情。”
在 2015 年被 推ter 收購的 Whetlab 內部,這項技術提供了一種更好的神經網絡設計方式。設計神經網絡需要大量試錯。與海量數據相比,軟件程序的作用顯得沒那么重要。這是一項十分困難而耗時的任務,但高斯過程和貝葉斯優化卻可以幫助人們自動完成項任務。
正如 WhetLab 創始人兼哈佛大學計算機科學家瑞恩·亞當斯(Ryan Adams)所說,這家創業公司使用“機器學習來改進機器學習”。神經網絡可能受到“自信錯誤”的困擾,而在識別不確定性的過程中,這種優化也有助于解決這類問題。亞當斯后來離開 推ter,加盟了谷歌的核心人工智能團隊——谷歌大腦。
一些研究人員還認為,以小數據為基礎的高斯過程將在推進自動化人工智能的過程中扮演至關重要的角色。“要開發真正的自動化代理,就必須能夠快速適應環境。”人工智能創業公司 Prowler CEO 維紹爾·查特拉斯(Vishal Chatrath)說,他也曾與加哈拉瑪尼共事,“這意味著要實現很高的數據學習效率。”
另外,查特拉斯還表示,高斯過程很容易解釋。與神經網絡不同,這種技術不會受到黑盒子問題的困擾。如果發生事故,完全可以找到問題根源。
別痛苦
查特拉斯已經為 Prowler 聘請了 3 位擅長這項技術的學者。該公司總部位于劍橋——加哈拉瑪尼和其他擅長高斯過程及相關技術的專家也都居住于此——他們正在開發能夠學會在大型多人游戲和其他數字世界中暢游的人工智能系統。這是一項復雜的工作,但他們希望借此開發出能夠在真實世界中暢游的系統。
與此同時,亞馬遜最近還招募了另外一位擅長貝葉斯優化的著名人工智能研究員、謝菲爾大學計算機科學家尼爾·勞倫斯(Neil Lawrence)。“別痛苦,”勞倫斯最近在博客中寫道,他很認同《銀河系漫游指南》里的內容,“通過引入數學工具來開發新一代深度學習方法,便可確保它們基本無害。”
來自: 騰訊科技