Andrew Ng:人工智能和機器學習驅動的“先進教育學”

jopen 10年前發布 | 18K 次閱讀 機器學習

        一個月前,Coursera 搬進了位于硅谷山景城的新辦公室,這里的墻上大大地涂鴉著“先進的教育學(Advance Pedagogy)字樣。

        除了融資達到了 8500 萬美元的規模,Coursera 直指創收的 Signature Track 項目也處于健康的增長曲線中。Signature Track 讓用戶可以選擇一套課程,完成后通過支付費用獲得證書。在 2013 年 7 月末開始這個產品后,達到第一個 100 萬美金收益花了 9 個月,隨后的 3 個月,這個收入就得到了翻倍,又三個月之后,這個收入數字變成了 400 萬,增長呈加速度。

        就在自己的公司處于良好上升態勢之時,創始人 Andrew Ng(吳恩達)則宣布加入百度的深度學習研究院。最近幾天,他正在密集地為百度面試人才,奔走于 Coursera 的新辦公樓和百度的新辦公樓之間。他說,能和他多年的好朋友、著名機器學習專家余凱一起工作,他感到相當興奮。

        在這個時間點上,從他對 Coursera 過去的設計、未來的構想,到如何運用網站收集的數據,到他未來更主要的職責——百度首席科學家,PingWest 與 Andrew Ng 進行了一次獨家訪談。

        PingWest = PW Andrew Ng =  Ng

        PW:Coursera 最初的學習和教育模式是如何被設計出來的?

        Ng:我做了很多事情,也經歷了很多迭代。2011 年的時候,我就開始思考 MOOC 運動,我在 2011 年建了 6 個網站,但只有 1 個最后呈現了病毒式增長,吸引了注意力。但其中的每一個都有后來的 Coursera 中的一些元素。

        我和斯坦福的朋友花了很多時間嘗試哪些是可行的、哪些不行。讓我來告訴你一些沒成功的,其中的一個網站是我們和高中合作,兩個人在那兒學習,我 輸入我的名字和郵箱,你也輸入你的,我們可以同步一起看教學視頻、一起做測試。這是個無比糟糕的點子,沒有人用這個網站。因為人們更傾向于自個學習,例如 你錯過了一些內容時,你想要停下來,而我想要繼續看視頻,這顯然是沖突的,人們都想要掌握視頻的控制權。

        對我而言,MOOC 最重要的一點在于規模化。在 Coursera 之前我就做了些關于眾包評分的研究,第一版 Coursera 的設計里其實沒有同學互改作業這一功能,在那一版里我教的機器學習,我朋友教的是數據庫分析課程,因為我們當時沒想清楚到底怎么做才是最好的,一直到第二 版的設計中才加入了它。

        PW:你對 Coursera 的愿景是什么?未來的計劃又是什么呢?尤其是邀請了耶魯的校長 Rick Levin 加入,Coursera 是否越來越像一所在線的大學?

        Ng: 今后,我的主要職責會是在百度,但我仍然會在 Coursera 全方位地幫助這個公司。我希望 Coursera 給每個人獲得良好教育的機會。我認為教育給予你超級力量(Super powers)。Coursera 未來不會變成一所大學,我們的大學合作伙伴在提供學位上做的已經非常好了。我們更愿意成為一個平臺,他們可以把內容放在上面。Coursera 不會提供學位,我們做別的事情。擁有一個學位在你的簡歷上非常有用,但有一個 Coursera 課程的證書也能一樣有用。這種證書是一種專長的象征。我認為,教育變得更加得模塊化,學位是一整塊長達 4 年的項目,但我認為大多數成年人不需要一個 4 年全日制的教育,他們需要一門或者幾門課程。所以教育會打散成模塊,我們在一個絕佳的位置去滿足這種需求。

         PW:在你看來,Coursera 是否在和大學競爭?

        Ng:我如果讓你想一下你最喜歡的老師,你和她愉快的對話交流,我們可以用電腦代替她嗎?答案顯然是否定的,甚至去做這種嘗試都是很愚蠢的。你最愛的老師畢生花了很多時間一年又一年地教授同一門課程、批改試卷。我認為機遇是在于,我們應該用技術來替代這些常規、重復的教學流程,這位你最愛的教授在未來就可以花更多的時間和學生交流對話,就像她和你之間產生的火花一樣。我不喜歡 MOOC 和教授們爭奪學生,MOOC 該做的是解放教職員工的時間,讓他們花費他們寶貴有限的時間來創造更多的價值。75% 我們的用戶,是已經有本科學位的。這種帶有證書形式的學習,是對大學教育的補充。你在大學學位上花了 4 年,那接下去 4 年呢?

        如果一個 18 歲的孩子被北大錄取了,有人爭論到底是去上北大還是在家學習免費的北大課程的話,我肯定會說,去北大念書去。你可以獲得更多更美好的經歷和體驗。

         PW:你曾經說過,在線教育是均衡器,讓每個人都能享受到教育。但你又提到,Coursera 的用戶 75% 都有了本科學位。已經受到良好教育的人通過 Coursera 學習更多的知識,而那些更需要知識來改變命運的人,比如高中輟學生,卻并不是 Coursera 的使用者,這樣在線教育如何發揮“均衡器”的功能呢?

        Ng:當我們說 75% 的人有本科學歷的時候,沒有說的那部分是,另外 25% 的人并沒有本科學位。我們覺得我們可以為這些人提供服務,真是太棒了!就算 Coursera 只服務了 100 萬沒有本科學歷的人群,都在一定程度增加了社會公平。Coursera 服務了 565 萬本科及以上畢業生,這不影響我們也服務了那 195 萬沒有本科學位的人這個事實。

        Coursera 使用者中,三分之一來自于發展中的經濟體。我們即為來自發達國家的人群服務,也服務到了發展中經濟體的這些人群。我在科技中看到的是,科技總是“涓滴”的,比如汽車、網絡,一定是有財富的人先使用上這些的。但科技總是縮小差距的,當智能手機剛出現的時候,有錢人先有使用機會,幾年之后的現在,有那么多人都有智能手機了。但我們在做一些事情加速這個過程,比如開發 Android 應用,我們發現,在貧困地區的人通常會花費很多時間在交通出行上,因此我們的移動端允許下載視頻,讓他們在出行路上看。

        PW:Coursera 在一些地區設立“學習中心(Learning hub)”,讓沒有網絡、甚至是沒有電腦的人群可以聚集在一起學習的項目,進行得如何了?

        Ng:我們對這個項目取得的成績滿意。比如說在肯尼亞這個,是在孤兒院里。我們也和各地的美國政府部門,比如領事館合作。他們會開放空間,來為當地沒有網絡的服務的人們提供 Coursera 的課程內容(總共和 30 個國家的領館合作,每個領館的教室數量在 10 – 70 個不等)。這個項目最大的挑戰在于,每個學習中心的人數還相對有限。在 Coursera,我們思考很多和規模化有關的問題。現在我們有 770 萬學習者,50 萬在中國,每天都有 12000 新用戶加入。我們試著讓自己的每個努力都可以規模化,這樣每個舉動都可以影響到更多更廣的人群。

        PW:你們在中國找到了很好的伙伴,他們貼近年輕人、用戶是有受教育的群體。Coursera 在進入中國市場前做了一些什么準備?

        Ng:當時我們要開始全球化的擴展,我們用很多方式做了分析,哪些有著龐大用戶量的國家是否有很好的因特網接入?是否用戶的英語足夠流利?是否 有足夠穩定的寬帶服務?我們從不同緯度做了調查,不管是哪一方面的調查,中國都在很顯眼的位置。審視我們在中國的用戶呈現出來的規律,我們發現網絡鏈接是 最大的問題,這是我們和網易合作的開始,把我們的一些視頻鏡像放在中國。我們的工程師團隊特地去中國驗證我們網站的運行速度,視頻速度仍然相當得緩慢。

        我們很幸運,果殼有一個討論社區,那上面已經有很多關于 MOOC 和我們的課程的討論。事實上,我們不記得到底是誰主導了這個合作,好像是我們的一個員工認識他們的員工,然后開始對話的。但我們確實發現他們和我們的價值觀一致,都相當地重視知識。

        PW:怎樣看待中國這個市場?對于 Coursera 而言,有什么獨特之處呢?

        Ng:我們在探索中國用戶規律上仍處于非常初級的階段。比如,中國用戶在使用社交媒體上和美國人使用社交媒體非常不同。我覺得我們還沒怎么弄清 楚呢。關于課程認證,我們發現越來越多的美國雇主把 MOOC 認證當回事了,如果你有一個在線課程的認證,雇主會因此給你一個工作的。在中國,這點仍然在推進之中,我們也仍然在研究如何向中國傳達這個信息。

        最大的不同是語言,中文課程在中國和臺灣更受歡迎。不過,有趣的是,也有一些美國人在上中文的課程。有件事是不斷地重復的:這個世界正在變得更 加得接近。另外一個中國和任何別的地方都不同的是,在中國,很大一部分 Coursera 用戶來自于大學。在其他地方,大學生的比例比較低,在中國這個數字接近 50%。

        PW:Coursera 收集的數據如何被用于理解人們的學習曲線?怎樣有效地促進有效的教育呢?

        Ng:課程被電子化了,因此所有在 Coursera 上的活動都是電子化的。你的每個動作都是可被追蹤的到——我們記錄每次點擊、作業、每個任務是否被正確批改修訂,我們知道你是不是在觀看視頻的中途暫停, 我們不僅知道你在討論組里寫了些什么,也知道你獲得的反饋。正因為有大量的學生,每個學生產生的數據,讓我們收集到的學習數據數量達到了史無前例的程度。 就在過去的一年里,Coursera 收集的教育數據,超過了過去 5000 年所有的教育數據總和。有了那么多數據,我們就此和大學院校的研究院合作,來理解人類學習這件事。

        比如說,如何去發現課程作業中是有錯誤的?你有一個包含 100 道題目的測試,如果這些試題中有些本身題目有錯,你如何發現它?你可能想,學生可能會答錯,確實。但僅僅是很多學生答錯了,這不代表一個測試本身含錯,也 許只是問題很難。在 Coursera 的數據里,因為學生做了很多的測試,我們可以知道哪些學生厲害,哪些有點弱,所以僅僅是因為問題比較難的話,厲害的學生答對的概率會更高。對于檢測本身含 錯的測試題,我們的標準是,強的學生并沒有比起弱的學生表現得更好。這是更可靠來識別本身含錯試題的信號。這是因為上千的學生做了測試,我們可以從數據的 角度來測試。

        PW:Coursera 的數據得出的結論是否對改進傳統課堂體驗會有幫助?

        Ng:這有點像“翻轉課堂”的理念。如果你在斯坦福教 100 個學生,你沒有足夠的數據來得出結論。在線課堂,你一下教 50000 個學生,數據就可以用來幫助提升教學內容,來更好地教斯坦福那 100 個學生。用我舉例子,有成千上百個學生讓我可以很容易發現一些常見的謬誤。

        有很多合作大學事實上從在線課程本身發展出創新來。比如喬治亞理工物理學的 Micheal  Schatz 教授,他想找出方案來改進實驗室課程。他讓學生丟東西然后用手機視頻記錄物體軌跡,學生可以逐個畫面地做分析來預測籃球落地位置,以此來學習牛頓運動定 律。每個學生的體驗都得到了提升。

        注:翻轉課堂(Flip Classroom)指調整課堂內外的時間,將學習的決定權從教師轉移給學生。學生主動基于項目進行學習,共同研究解決本地化或全球化的挑戰以及其他現實世界面臨的問題,從而獲得更深層次的理解。

        PW:是否大型開放式網絡課程(MOOC)由于參與人數眾多,也可以幫助一些教授完成他們的研究?

        Ng:這不是在線公開課的主要用途,但是一兩個課程確實用到了這個概念。在線公開課最珍貴的時形成了一個相互分享信息的社區。比如,有老師在教 食品標簽的課時,讓每個學生都跑到超市里去拍食品標簽然后放到討論論壇上,這個東西全世界都不一樣,很有趣。你想想除了這里,還有哪里你能看到全世界各地 的食品標簽呢?對學生而言,他們看到了全世界各種不同的食品標簽,因為參與了課程,每個學生的體驗都得到了提升。如果你只是在舊金山或者北京教課,你沒有 辦法獲得如何豐富的有趣體驗。

         PW:Coursera 和你的本業,機器人、機器學習以及人工智能有什么聯系嗎?

        Ng:有那么一點,但是不多。MOOC 收集了那么多數據,我們一直使用人工智能和機器學習來分析這些數據,我剛剛說的這些故事都是使用機器學習的工具實現的,這是前所謂的教育數據,不過我不太 可能把這些數據用在深度學習領域。Coursera 有的數據非常獨特,我們有那么多教育數據,在此之前沒有人收集過這些,我們發現即使是很簡單的分析都能發現相當有意思的結果。

         PW:加入百度之后,你對構建這個實驗室有什么規劃?

        Ng:人工智能是非常資本化和集約化的,我們想造下一代的深度學習系統,需要許多相當昂貴的計算機、要具有性能良好的計算力,雇傭一大批人工智 能領域的專家和計算機系統的專家。教育和人工智能都是非常讓人興奮的問題,但是有很多人都愿意留在人工智能領域。很幸運,硅谷有很多人愿意在人工智能領域 工作,余凱和張潼彼此是好朋友已經很多年了,他們在百度做的很多工作都非常讓人振奮,余凱做的很多深度學習的研究工作,比我見過的很多東西都要先進許多許 多。我和他也是好多年的朋友,將要和他一起工作讓我非常興奮。

        對于中國公司拷貝美國公司的傳統固見已經過時了,你看許多中國的創新對中國是獨特的,美國的創新對美國是獨特的。我們有兩個不同的生態系統。美 國的公司,平均而言,有著更成熟的技術,但我看到了很多在中國的創新,比如說余凱的深度學習項目。我相信,以后我們不再會說“中國制造”,而會說“中國創 造”。

                    <span id="shareA4" class="fl">                            
                        </span>
 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!