為了避免成為代碼狗,程序猿開始用AI來訓練代碼

jopen 8年前發布 | 19K 次閱讀 程序員

為了避免成為代碼狗,程序猿開始用AI來訓練代碼

英文原文:Soon We Won’t Program Computers. We’ll Train Them Like Dogs

在計算機發明之前,大多數實驗心理學家認為,大腦一個不可知的黑盒子。你可以通過響鈴、狗分泌唾液來分析一個主體的行為,但思想、記憶、情緒這些東西都是模糊莫測,超出了科學的范圍。因此,這些自稱行為主義者,局限于自己的研究:刺激和反應,反饋和強化,鈴鐺和唾液的研究。他們試圖放棄了解頭腦的內部運作,統治了該領域四十年。

然后,在上世紀 50 年代中期,一群叛逆的心理學家、語言學家、信息理論家,和早期人工智能研究人員對頭腦想出了一個不同的概念。他們認為,人不只是條件反射的集合。他們吸收信息,處理信息,然后對它采取行動。他們有專門的編寫、存儲和調用記憶系統。他們通過邏輯、形式語法來操作。大腦并不是一個黑盒子,它更像是一個電腦。

所謂的認知革命開始時規模很小,但隨著計算機在心理學實驗室在全國范圍內普及,它獲得更廣泛的認可。到 70 年代后期,認知心理學推翻了行為主義,同時出現了談論精神生活的全新語言。心理學家開始描述思想為程序,老百姓談到把事實存儲在他們的記憶銀行,商業領袖開始擔憂在現代工作場所心理承受能力和處理能力的極限。

歷史總是不斷重演。隨著數字革命滲透到我們生活的每一部分,它也滲透到我們的語言,和事情如何運作深刻、基本的理論。科技始終做到這一點。在啟蒙時期,牛頓和笛卡爾啟發人們把宇宙想象為一個精心制作的時鐘。在工業時代,它是帶活塞的機器。 (Freud 關于心理動力學的思路,是從蒸汽機的熱力學借鑒來的。)現在它是一臺電腦。這就是說,當你想想看,一個從根本上賦予自主權的想法。因為如果世界是一臺電腦,那么代碼可以改變這個世界。

代碼合乎邏輯。代碼容易被破解。代碼是命運。這些都是生活在數字時代的核心原則(和自我實現的預言)。隨著軟件吞并了世界,套用風險資本家 Marc Andreessen 的話,我們的周圍都是把我們的行動、思想和情緒轉化為數據,即代碼工程師操縱的原料。我們把生活本身看成是可以被發現、開采、優化、甚至改寫的一系列指令。公司利用代碼來了解我們最親密的聯系;非死book 的 CEO 馬克·扎克伯格很早之前就提出“人類的關系上有基本的數學定律,支配著人們關心的人和事”。2013 年,Craig Venter 宣布,在對人類基因組解碼的十年后,他現在已經開始寫代碼,允許他創造合成生物。 “現在越來越明顯,”他說,“地球上已知的所有活細胞 DNA 都是軟件驅動的生物機器。”即使自助文獻堅持,你可以黑自己的源代碼,重新編程你的愛情生活、你的睡眠習慣、你的開銷習慣。

在這個世界上,寫代碼的能力已經不只是一個理想的技能,而且是與掌握內幕狀態的敲門磚。他們可以訪問權力的杠桿。 “如果你控制了代碼,那你就控制了世界。”未來學家 Marc Goodman。 (Paul Ford 稍微謹慎:“如果程序員不控制世界,他們將控制主宰世界的人。)

但是不管你是喜歡還是討厭這種狀況,無論你是精英程序員或數碼白癡。機器開始使用一種不同的語言,即使再好的程序員也不能完全理解。

在過去的幾年中,美國硅谷最大的高科技公司都在積極尋求機器學習的計算方法。在傳統的編程,電腦遵循工程師寫的明確、一步步的指示。有了機器學習,編程人員不再為計算機編碼。他們“訓練”計算機。比如說,你想教神經網絡識別貓,你不用告訴它看胡子、耳朵、皮毛和眼睛。你只需把成千上萬貓的照片給它看,最終它會自己分辨。如果把狐貍錯認為貓,你不需要重寫代碼,你只要保持訓練。

這種做法并不新鮮,它已經存在了幾十年,最近才變得非常強大,部分歸功于深層神經網絡的興起,模仿在大腦神經元的多層連接的廣泛分布的計算系統。不管你是否意識到,機器學習的力量遍布我們的在線活動。 非死book 使用它來決定哪些故事出現在你的新聞頭條,谷歌照片用它來識別面孔。機器學習運行著微軟的 Skype 翻譯,它可以實時將語音轉換為不同的語言。自動駕駛汽車使用機器學習來避免意外。即使多年來在人工書寫的復雜體系頂端的谷歌搜索引擎,也已經開始依靠這些深層次的神經網絡。該公司于今年二月聘請了機器學習專家 John Giannandrea 為搜索的主管,同時它已發起一項重大計劃培訓工程師學習這些新技術。 “通過建立學習制度,”Giannandrea 告訴外媒記者,“今年秋天,我們不必再編寫這些規則。”

但問題是:有了機器學習,工程師將不知道電腦是如何完成其任務的。神經網絡的運作在很大程度上是莫測的。換言之,它是一個黑盒子。隨著這些黑盒子在日常數字化任務承擔更多的責任,它們不僅會改變我們與技術的關系,它們還會改變我們如何看待自己、看待世界、看待我們在世界的位置。

如果舊觀點的程序員都像神,創作支配計算機系統的法律,那現在他們就像父母或馴狗師。任何父母或狗主人都會告訴你,這是一個更為神秘的關系。

Andy Rubin 是一個根深蒂固的工匠和程序員。他是 Android 操作系統的聯合開發者,Rubin 在硅谷臭名昭著因為他的工作場所和家里都是機器人。他自己為它們編程。 “我很年輕的時候就進入計算機科學,我很愛它,因為我可以消失在計算機的世界里。這是一塊干凈的白板,一塊空白的畫布,我可以從頭開始創建東西,”他說。 “多年來它給了我一個完全控制的世界。”

現在,他說,這世界即將結束。Rubin 對機器學習很興奮,他新公司 Playground Global 的崛起,投資了機器學習的創業公司,并把自己定位為引領智能傳播設備,但他同時也有一點傷心。由于機器學習改變了成為工程師的意義。“人們不會直線地寫項目,”Rubin 說。 “在神經網絡學會之后語音識別,程序員不能進去看它是如何發生的。就像你的大腦。你不能砍掉你的頭,來看你在想什么。”當工程師們陷入了深深的神經網絡,他們看到的是數學的海洋:一個巨大的,多層的微積分問題不斷推導數十億的數據關系點,產生對世界的猜測。

人工智能不應該以這種方式工作。直到幾年前,主流的 AI 研究人員才假設要創造智能,我們只需要用正確的邏輯來灌輸機器。編寫足夠的規則,最終我們會創造足夠復雜的能了解世界的系統。他們在很大程度上忽視,甚至污蔑機器學習。多年來,電腦都沒有強大到足以真正證明這兩種方法的優劣,所以爭論成為一個哲學問題。 “大部分這些爭論都是基于對世界怎么組織和大腦是如何工作的固定的信仰,”創造了谷歌的自動駕駛汽車的前斯坦福大學人工智能教授 Sebastian Thrun 說。 “神經網絡沒有符號或規則,只有數字。這疏遠了很多人。”

一種不可分析的機器語言的意義不只是哲學。在過去的二十年里,學習編程代碼一直是就業最可靠的途徑。但是,神經聯網深度學習機器運行的世界需要不同的員工。分析師已經開始擔心人工智能對就業市場的影響,因為機器使老技能無用。程序員可能很快就會失業。

“我今天上午才說了這些,”當我問他這種轉變時,技術大師的 Tim O'Reilly 說。 “我當時指出當所有這些接受 STEM 教育的孩子們長大的時候,編程工作將如何不同。”傳統的編碼不會完全消失,事實上,O’Reilly 預測,我們在很長一段時間仍然需要編碼,但有可能會漸漸少用它。正如量子力學的發現沒有消除牛頓物理學,代碼將保持一個強大的,可能不完整的工具集來探索這個世界。但是,當涉及到具體職能,機器學習會為我們做大量的工作。

當然,人類仍然要訓練這些系統。但至少現在,這是一個純凈的技能。這項工作既需要對數學的高層次把握和對教學給予和采取的直覺。 “這幾乎就像在這些系統以獲得最佳的藝術形式,”領導谷歌的 DeepMind AI 團隊的 Demis Hassabis 說。 “世界上只有幾百人能把這一點做到非常好。”但是,即使是微小的數字已經足以在短短的幾年改變技術行業。

無論這一轉變對專業造成何種影響,其對文化的影響將是更大的。如果人編寫的軟件的上升導致了工程師的崇拜,即人的經驗最終可以簡化為一系列的理解的指令,和機器學習兩個概念在相反方向搖擺。運行宇宙的代碼可能違抗人類的分析。例如,目前谷歌,正面臨歐洲反壟斷調查,指控該公司在其搜索結果施加不當影響。這樣的指控將是難以證明的,甚至公司自己的工程師不能說清楚其搜索算法究竟是如何工作的。

即使是簡單的算法可以產生不可預知的突發行為、可以追溯到混沌理論和隨機數發生器的洞察力。在過去的幾年中,隨著網絡變得更加緊密相連,其功能越來越復雜,代碼似乎已更像一個外星力量,機器變得更加難以捉摸和難以統治。飛機無理由停飛。看似不可預防的崩潰的股市。輪流停電。

這些力量已經導致技術專家 Danny Hillis 宣報啟蒙運動時代的結束,我們對邏輯世紀之久的信仰,確定性和對自然的控制。Hillis 說,我們將轉移到他所稱的糾纏的時代。 “隨著我們的技術和制度的創作變得更加復雜,我們也它們的關系發生了變化,”他在《Journal of Design and Science》寫道。 “我們不再是創造的主人,我們已經學會與它們討價還價,在我們目標的大方向哄騙和引導它們。我們已經建立了自己的叢林,而它有自己的生命。“機器學習的崛起是最新的,也許是這個旅程中最后一步。

這一切可以是相當可怕的。畢竟,編碼是一個普通的人能想象在新兵訓練營學習的事情。編碼者們至少是人。現在的科技精英更少,而且他們對自己的作品命令已經減弱,并且間接的。已經建設了機器學習的公司發現它是很難治理的。去年夏天,谷歌的照片識別引擎開始把黑人標注為大猩猩,公司火速道歉。

這一切都意味著一個時代即將到來,我們喪失對自己機器的權力。 “可以想到這樣的技術智勝金融市場,比人的研究更先進,比人類領袖更會操縱,其開發的武器,我們甚至無法理解,”Stephen Hawking 寫道,伊隆·馬斯克和比爾·蓋茨等等呼應。 “雖然 AI 的短期影響取決于誰控制它,長期影響取決于它是否能被控制。”

但不要太害怕。我們只是在學習與一項新技術的交戰規則。目前,工程師們正在把深度學習系統變得視覺化。但是,即使我們永遠不能完全理解這些新機器是怎么想的,并不意味著我們會在它們面前無能為力。在未來,我們將不會關注它們行為的深層根源;我們將專注于學習行為本身。我們用來訓練它的數據都將比代碼重要。

如果這一切似乎有點眼熟,那是因為它看起來很像 20 世紀的行為主義。事實上,培養機器學習算法的過程經常被比作 20 世紀初的偉大行為主義實驗。巴甫洛夫觸發了他的狗的唾液不是通過對饑餓的深刻理解,只是通過一遍又一遍重復的事件。他一遍又一遍提供數據,直到代碼重寫它本身。

從長遠來看,Thrun 說,機器學習將有民主化的影響力。和你不需要知道 HTML 就能建立一個網站一樣,你最終將不需要博士學位就能接觸深度學習的瘋狂力量。編程不再會是學習了一系列神秘語言訓練程序員的唯一領域。任何曾經教狗翻身的人都可以訪問。 “對我來說,這是編程里最酷的東西,”Thrun 說,“因為現在任何人都可以編程。”

對于很多計算歷史,我們已經采取了一個機器是如何工作由內而外的視圖。首先,我們寫代碼,然后機器來表述它。這種世界觀暗示可塑性,但它也表明了一種基于規則的決定,從某種意義上說,事情是它們底層指令的產物。機器學習暗示卻相反,由外向內的視圖不只是確定行為,行為也決定代碼。機器是世界的產品。

最終,我們將體會到手寫線性碼和機器學習算法進行調整兩者的力量。生物學家可能已經開始搞清楚了這一點。基因編輯技術如 CRISPR 給他們傳統的軟件程序員們對代碼的操縱力量。但在遺傳學領域的發現表明,遺傳物質其實也不是不可變的指令集,而是一個動態組根據其主機的環境和經歷調整開關。我們的代碼不是從物質世界分開。Venter 可能認為細胞 DNA 是軟件驅動的機器,但實驗胚胎學家 Steve Cole 提出不同的表述:“一個細胞是把經驗變成生物學的機器。”

而現在,自阿蘭·圖靈第一次勾畫他設計的解決問題的機器 80 年代以后,計算機成為了把經驗轉化為技術的設備。幾十年來,我們尋求可以解釋、調整、優化我們對世界體驗的秘密代碼。但是,我們的機器將無法長期以此方式工作,我們的世界也從來沒有這樣。我們即將與技術建立更復雜,但最終更有價值的關系。我們會從指揮設備,到培育他們。

來自: 雷鋒網

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!