Andrew Ng的機器學習問答季

jopen 8年前發布 | 18K 次閱讀 數據挖掘

Writing Sessions是知識共享網站Quora推出的一個與專家交流互動的新板塊,在這里你可以看到各個行業領域的專家、學者、名人等對引人注目的問題的獨特見解。最近推出的系列圍繞如今最熱門的技術之一——機器學習所展開,本次機器之心推送是百度首席科學家、Coursera主席、創始人之一、斯坦福大學教師Andrew Ng在Quora上對部分問題的回答,后續還會陸續更新并推出其他專家系列,敬請期待!

問題一:AI對人類存在威脅嗎?

在當今,擔心人工智能的罪惡超能力就如同擔心火星移民計劃導致的人口過剩一樣,為時過早。因為實際上,我們甚至還沒有登陸到火星表面!

人工智能目前已經有了巨大的進展,并且我對于機器智能技術由上之下構建服務更好的人類社會抱持樂觀態度。但是到目前為止,人工智能的發展仍然非常局限。幾乎所有深度學習的經濟價值和社會價值仍然依賴于監督學習,即同時受限制于特定格式(比如,標記過的數據)。即便人工智能已經能夠幫助者數億人,并以積極的姿態準備去幫助更多的人,我也仍然沒有發現任何現實意義上能夠威脅到人類社會的人工智能方法。

長久來看,我發現很多種除了監督式學習之外的人工智能方法技術都非常激動人心,比如無監督式學習(由于數據無需再被標記,就有了更多的可用數據)。我個人或是其他的研究組在其他形式的學習方面也都有很多令人振奮的進展。我們所有人都希望看到一個技術性的突破,但誰都沒法預測什么時候會真正到來。

我認為諸如對于 「邪惡智能殺手」的恐懼,已經都成為了決策者和領導人濫用資源來解決一個根本不存在的幻影的借口。實際上人工智能會引發的其他問題,但更集中于工作的取代上。即便人工智能在未來十年能夠幫助我們建立一個更好的社會,我們作為人工智能的創造者同時也應該對可能引發的一系列問題肩負起應有的責任。我希望MOOCs(Coursera)成為解決問題的一部分,但是我們仍需要除教育之外更多的東西。

對于這個問題,我們看看深度學習三巨頭之一的Yoshua Bengio的回答:

在未來,我們是否能研發出具備人類水平智能、甚至超越人類的AI?這個問題依然有很大的不確定性。盡管我是一個樂觀主義者,但基于上述不確定性,我不能否認,我們不想看到的事依然有可能會發生。這就是我在FLI(Future of Life)呼吁AI應該穩健且有益于人類的 公開信 上簽字的原因。

然而,必須注意到,這種潛在的危險距離現在的我們還很遙遠。新聞媒體總傾向于在這方面夸大其詞,以吸引注意力。這將損害AI研究。相反,我們應該鼓勵研究者去更好地理解這些問題,如果有那么一天這些問題真的迫在眉睫,他們能讓我們準備好,并為我們提供尊重人類價值的更安全的AI。

說到這里,我相信,將媒體的注意力從科幻片中的長期恐懼轉向AI短期內可能帶來的更具體的社會、經濟和政治問題上,是一件很重要的事。但是,我們必須提前思考這些問題,不要等到大多數人遭受不幸(比如失業)而少數幸運者變得超級富裕且強勢時才想到這些問題。在決定要怎樣使用AI帶來的進展時,我們必須發揮群體的智慧,讓它有利于大多數人,而不是少數人。為了與科技帶來的不斷增長的力量相匹配,弱肉強食的叢林法則是不合適的:為了當代人以及我們后代的利益,個人和群體的智慧都必須有所增長。

問題二:無人駕駛汽車何時能真正上路?

我希望在三年之內能夠看到大量的無人駕駛汽車問世,而在五年之內能夠進行大規模生產。(如果你愿意,你可以在你的日程中寫下這一點,三到五年之后再來檢驗我的預測是否正確。)

最近我們剛剛度過了斯坦福大學贏得DARPA無人駕駛汽車挑戰賽十周年紀念日。但是為什么無人駕駛技術花費了這么久的時間還沒有成熟呢?

首先,我認為建造一輛可以滿世界跑的汽車的方法本身就非常具有挑戰性,而且通常情況下第一個要解決的目標也是錯誤的(或者說不切實際的)。無人駕駛汽車最大的問題是解決所有的極端情況——即每行駛1萬甚至10萬英里才會發生的一些奇怪的事情。機器學習有助于將你的表現從90%的準確率提高到99.9%,但是卻不會從99.9%提高到99.9999%。我認為以另外一個目標為起點或許更合適(更有希望):區間車只能選擇一條巴士路線,或者僅僅在很小的范圍內活動。如果我們可以保證該路線的道路表面和車道標線維護良好,例如沒有進行施工等;這樣我們可以使得可觸范圍內保持真正的安全;然后依照這樣我們可以慢慢加入新的路線,從而逐漸使得在這個區域內我們都能安全行駛。這也是百度正在進行的方案,我希望其他的小組也能采取這樣的方法。

其次,汽車看待世界的方式和我們不一樣。例如,今天的計算機視覺不能有效地分辨建筑工人朝你揮手時是在讓你「過來」還是「停下來」。另一方面,我們的無人駕駛汽車并沒有任何的盲點,隨時都可以進行360°全方位觀察;我們的車載HPC系統的反應速度也要比人類的反應速度要快。因此,我并不認為我們應該期待無人駕駛汽車和人類駕駛汽車的方式一樣。我們可以讓無人駕駛汽車變得安全、有預測能力和更加可靠;但是,它們將會和人類駕駛的汽車不同。作為技術人員,我們必須要有政府和社會的參與,他們的參與不僅可以幫助建立新的法規,而且能有效l了解社會對于這些汽車的新期望。

當然,對于無人駕駛汽車的未來,我們非常樂觀。它將幫助人類節省大量的時間,以及避免大量的交通事故。我希望全球的科技社群能夠和政府與社會一起,通力合作,早日實現這一美好愿景。

問題三:未來20年的工作會是什么?

如果你是一名50歲的貨車司機,有一天你的工作突然被自動駕駛汽車搶了,你該怎么辦?

其實,我們的社會是很擅長為有技能的人提供機會的, 問題在于30多年累計的經驗技能在一息之間就貶值了。在這種情況下,我們有道德上的義務去幫助這些受影響的個體,獲取新技能和新機會。

幸運的是,隨著MOOCs及其他可快速擴張的教育形式的興起(如 Coursera, Khan Academy, Lynda),我們現在可以用較為實際的成本做到這點。我并不為20年后我們是否會缺少重要的工作崗位而擔心,因為其實有很多人們正在擔任的工作是機器在當下或許在可預見的未來都無法勝任的; 但是我為個體的再教育需求感到擔心。

同時,我認為基礎收入也是有必要的。這樣做可以為個體提供保障措施以及獲取新技能的機會。當今社會以及政治現狀可能還不能接受「毫無緣由地付錢給人們」這個想法。所以,我提議向人們支付薪水,作為他們學習的回報。 這樣,既不會使大家無所事事,又可以有效地引導失業者去做一些有利于他們重新進入勞動大軍的事情。

我十分喜歡Erik Brynjolfsson和Andrew McAfee寫的 「第二次機器時代」,他們在其中有討論這些問題。

問題四:開啟機器學習職業生涯最好的方法是什么?

Cousera上的斯坦福大學的機器學習課程就是為了讓更多的人可以開始接觸機器學習而設計的。如果你熟悉基本的編程(通過任何一種語言),我都推薦你從這個課程開始。

很多人通過完成了這門網絡公開課得到了機器學習相關的工作。還有一些其他的類似的課程也很有用;比如約翰霍普金斯的數據科學專家系列。參加Kaggle或者其他的機器學習競賽也幫助很多人獲得了不少經驗。Kaggle有一個帶有在線討論的社區,你可以從中學到很多實用的技巧。參加本地的meetup見面會或學術會議(如果你愿意付這個價錢),還有多和有經驗的人聊聊也很有幫助。

但是最重要的是要堅持學習。不單單是幾個月,而是幾年。

每周六,你都要在是在家里讀論文或實踐算法與看電視之間選擇。如果你整個周六都在工作,短期內也不會有太多回報,而且你現在的老板甚至不會知道,也不會對你說「干得好」。此外,即使一個周六的學習過后,你也不是真的就對機器學習那么在行。但是秘密在于:如果你不僅僅只是一個周末如此,而是堅持這樣學習一年,那么你會變得非常優秀。

如今社會對具備機器學習技能的人才有很高的需求;一旦你得到一份機器學習的工作,你的學習只會進步的更快。

世界需要更多的懂得機器學習的人來幫助解決問題。我們的社會有太多的數據和計算資源,(這些使得)機器學習就像有超能力一般,允許你創造令人震驚的東西; 但是現在只是沒有足夠的(懂的機器學習)的我們來做這些事。我希望我的讀者們可以更加努力,學好機器學習。

對這個問題,我們來聽聽Yoshua Bengio的回答:

首先,你要經過基礎的數學和計算機科學的訓練。就深度學習而言,你可以看麻省理工出版社出版的深度學習的書的第一部分(現在網上有電子版,最終麻省理工出版社會出版紙質版)來溫習或者看數學和計算機科學領域最相關的內容。然后你需要閱讀機器學習方面的內容,比如Chris Bishop和 Kevin Murphy的書,Andrew Ng的coursera課程,和Hugo Larochelle關于神經網絡的視頻,然后你在深度學習書的第五部分中總結出許多基本問題。然后你就需要開始練習了,比如自己編寫一些算法,用數據訓練它們,試著參加Kaggle的比賽。試著在優化超參數和選擇合適模型方面成為專家,同時繼續閱讀。如果你對深度學習感興趣,我的書的第二部分會告訴你最基本的算法基礎。此時,你已經有足夠的知識背景積累,可以開始選擇你喜歡的書籍閱讀了。

問題五:Coursera早期時候最有趣的故事是什么?

慕課(MOOCs)從早期創建就與眾不同。

2011年,斯坦福大學推出了三個引人注目的MOOCs,包括機器學習、數據庫和人工智能;也正是這一舉動導致了今天的MOOC運動。人們當時的反應是,「哇,這真的是橫空出世的新鮮事物!」

但是如果你是其中的建造者之一,你就會看到它一步步的發展歷程,到最后如何實現了「橫空出世」。2011年推出的這個MOOC是我做的第六個在線教育網站。之前的一些都遠不如這一個網站成功,或許你從未聽說過。但是我們從早期的原型中不斷地學習、總結,直到2011年我們成功地建立了這樣實現質變的產品。從Jennifer Widom和我寫的《現代MOOC的起源》中你可以讀到更多早期的故事(我們倆負責2011年MOOC推出的三門課中的兩門)。

后來,在深度學習中我們也看到了類似的現象。在外行人看來,他們的印象是「哇,這真的是橫空出世的新鮮事物!」(這種類似反應出現在2012年,當時我正負責谷歌大腦計劃,并宣布了貓的研究結果。)但是對于我們中這些為MOOC工作多年的人來說,這種進步真的是一步步取得的。

線性范疇上的指數式進步看起來通常都是一個不連續的變化過程。在科技領域我們看到了太多這樣的例子。

既然你問了這樣的問題,這里我就講述一個故事:2011年,我與斯坦福大學的四個學生一起工作。我們需要為已經注冊的10萬學生建造新的功能,因此我們的壓力非常大。其中的一名學生(Frank Chen)聲稱另一名學生Jiquan Ngiam經常將他滯留在斯坦福大學的大樓中,知道深夜才讓他搭車會宿舍,因此他沒有別的選擇,只有留下來并繼續工作。我從來沒有去核實這件事情的真實性。

(未完待續,敬請期待……)

本文選自Quora,機器之心編輯出品,參與成員: Angulia、楊超、Yipu、之乎、Rita、汪汪、孟婷。

</div>

來自: http://www.almosthuman.cn/2016/01/30/kuu4x/

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!