騰訊副總裁姚星:解密“低調”的騰訊AI部門,揭開AI真實的希望和隱憂
在騰訊研究院年會中,騰訊副總裁姚星發表演講《AI 真實的希望和隱憂》,他在大會中介紹了“低調”的騰訊 AI 部門所做的事,并深入講解該如何提升機器學習的能力以及對 AI 的看法。
騰訊在 AI 方面確實很低調,很多人問我騰訊有沒有做 AI?怎么從來沒有向外宣傳呢?
解密騰訊 AI 部門
實際上從 2016 年 4 月份開始,騰訊成立了自己的 AI 部門。目前這個部門擁有 30 多個科學家,90% 以上的人都是博士學歷,絕大多數人都是海外名校歸來,包括哈佛、康奈爾、麻省理工、哥倫比亞大學等高校。
騰訊的 AI 可能并不像其他巨頭那樣出名,比如說擁有 AlphaGo 的谷歌;擁有無人車和度秘的百度;以及擁有一些優秀圖像識別項目的 非死book 等等。
騰訊 AI 主要是集中在四個垂直領域:計算機視覺、OCR、語音識別、NLP。每一個領域里都會拓展到更多深層次的研究。在計算機視覺領域,除了傳統的圖像處理,還會涉及到 AR 以及空間定位技術等。
語音識別方向,除了傳統的語音識別、語音合成,還會將相關技術置入在自動翻譯當中。另外,除了傳統的自然語言處理這種認知行為的研究,騰訊還這些技術進行落地研發聊天機器人等。
騰訊這四個 AI 研究方向,與騰訊現有的業務緊密結合。
騰訊作為一家社交為長的公司,會根據社交業務創造 AI 能力和產品,包括聊天機器人、智能助手,都會在社交的基礎上進行研究。
與此同時,游戲是騰訊非常重要的一項業務。未來騰訊會在游戲里面引入更多 AI 能力,設想這樣一個場景,未來 LOL 是不是可以有 AI 參加這種世界競賽,跟人對打。騰訊也有一款很受歡迎的手游叫做王者榮耀,如果利用 AI 把這里面的能力提升,就會提高可玩性和樂趣性。
除此之外,騰訊還會提供我們很多工具類 AI,包括人臉識別、語音識別、自然語言處理,以及學習平臺等。
機器學習取得突破的三大原因
AI 在這 60 年來一直都是起起落落,然后在去年突然大爆發,一直延續到現在。
從九十年代深藍打敗了卡斯帕羅夫,到沃森在《危險邊緣》挑戰賽里面取得了冠軍,再到去年 AlphaGo 擊敗李世石。AI 的整個發展史里有很多技術方面的巨大演進,第一個就是 2006 年在深度學習上的突破。早期人類想學飛翔,最初的方法是粘上羽毛,像鳥一樣。但最終真正的飛翔原理是要通過空氣動力學去解決飛鳥的原理,這就是深度學習的一個思想。之所以現在能在很多的這種工業上面,在很多應用上面進行突破才能完成,本質上是掌握了它內在的方法,而不是表面的方法。人工智能也如此,學習算法方式的研究是非常重要的。
第二個是模型上的提升。機器學習在八九十年代也非常火,當時有一個叫 SVM,它已經是一種非常厲害的機器學習算法。當它達到幾億、幾十億規模的時候,實際上它的計算能力就會急劇下降,做一個非常復雜的復合函數去描述這種方式,它通過 BP 多層連接,達到一個指數層倍的關系,描述十億可能只需要三層一千個節點的連接,就能構建十億個特征出來。所以從本身來講,模型上的提升這也是深度學習的突破。
第三是在數學層面,即 BP 上面問題的解決,反向傳播的問題。首先在數學理論上進行,反向傳播是一個非常復雜的問題,在神經網絡里面當一個東西在傳遞很多層網絡中時,當它往回我們要反向收斂的時候,均要去逼近最優質。但是當層數往往過多的時候,會發生一個梯度消失或者梯度膨脹的問題。通過一些方法的解決,數學理論上的解決,很好解決了這種問題,所以在數學理論上面,建立了一個比較好的基礎。
正因為這三方面的優勢,所以才使得機器學習如此火。而且這次浪潮會持續很遠,在 1933 年到 2000 年左右,整個傳統的淺層機器學習的學習方法,它有一個比較好的下降過程,但是 2000-2010 年這十年,它進展非常快。
在方法和模型上面可能都沒有進行,突然在 2012 年左右,微軟研究院他們最開始在工業界把機器學習用到語音識別里面去,取得了極大性的突破。整個過程機器學習的能力的確是在過往的五年當中,發展非常非常快的。講了很多機器學習的這種,剛剛說的發展,快速的發展,它的方法也很好,模型也很好,數學算法也在突破,但是現狀是什么呢?
人工智能的局限性
我雖然對 AI 的抱有很大期待很,同時認為 AI 還存在很多的局限性。
第一個就是本身深入學習的能力。AI 跟人去相比,它有較大的差距。實際上現在所有的機器學習方法,我們都發現不管這個方法有多么的新提出來,它的學習過程都是要從頭開始學,都要把數據重新進行一次訓練的過程。
但這跟人的學習能力相比確實有很大的差距,人有很多的智能是與生俱來的,就像小孩剛出生,不需要多長時間就知道這個世界是三維的,當你把一個東西放在一個,把一個瓶子放在電視機的后面,他是知道的,在電視機后面有一個東西的,這是一些特征是與生俱來的,這個是跟生物的進化是相關的。
所以人的這種,靈長類的動物跟單細胞動物相比,肯定是有與生俱來的能力。但是目前深度學習方法很遺憾,科學家們不管提出了多么優秀的模型,都要重新開始學,這是第一個跟人的學習能力相比,機器非常大的缺陷。
第二是不管有多么好的學習模型,它本質上還是通過算力,利用計算能力去解決大數據,用更大的計算能力去做更好的融合。過往是整個硬件發展,是順從了摩爾定律發展,發展非常之快,但是在未來的更多的參數下面,人們還有沒有這種能力,達到計算的效果,這要打上很大的問號。
再比如說 2006 年提出來的網絡模型,到后面劍橋大學提出的模型,再到谷歌,再到 2015 年神經網絡。每一次新的模型提出都是把模型的層數加入更多,神經單元更復雜,訓練結果更長,得出來的結果也最優。但是本身這種方法是不是還能像原來的方法一樣可持續,這要打一個很大的問號。另外一個剛才解決的是圖像方面的問題,下面解決感知的問題,如果要解決認知的問題,那差距就更大了。
人的語言是一個序列問題,這個語言序列問題如果要計算的話,這個算力無論如何都解決不了。人可以很容易在對話當中,回溯到一個很長時間語句的某個片段的關鍵詞里面,但是在機器里面它卻不一定做到。雖然在最早的模型形成到現在長短記憶單元的模型,到現在騰訊的,帶有注意力的模型,但是總之來講,這種模型的演進都還跟人相比是非常復雜的,是遠不如人的。
比如說那天我看到一個對話,是三個人在對話,兩個人在聊,中間有大段聊去哪兒吃飯,突然有人問太陽呢?人知道這是描述太陽隊的,因為前面很早之前有人在聊,湖人跟快船的話題,突然來個太陽大家就知道,但是機器基本上是沒辦法識別的。夏天能穿多少穿多少,冬天能穿多少穿多少,兩句基本上一樣,但是前面去描述,把少給突出來了,后面把冬天多顯出來。
第二個例子我講的是語音識別,我看了一個笑話,語音識別很難搞,您好,方便面試嗎?我在重復這句話的時候,我都不知道自己在講方便面試嗎,還是方便面是嗎,的確這是一個非常難的問題,但是人的意識里有很多東西,是由于進行反問的時候,再慢慢把這個東西帶出來。所以說目前的 AI 情況,在圖像里面,包括人臉做的多么多么厲害,實際上它在很多的約束條件下,它可能不能通過側臉去識別人臉,戴帽子的時候也比較難。所以它是在很多約束條件下面,人臉識別率可能只達到了 9%。這些問題也體現在語音識別上,語音識別也是在噪音比較小、沒有風噪、車噪的環境下,機器識別率會有一個比較好的效果。但機器與人的基本能力相比還差距很大,更別說它在認知方面,在 NLP 方面。
如何提升機器學習的能力?
AI 與人,包括機器學習與人能力上的有些差距,怎么去補齊差距呢?
第一個我覺得跟人相比要創造,我們現在所有都是基于大數據,這些數據從何而來,這是非常重要的。這個數據現在是傳統的獲得而來,但更多的數據是本身能創造出來,當然這條方法通過剛剛主持人介紹的,包括 AlphaGo 已經在驗證這樣的問題,通過增強學習去產生人類從未下過的棋,這是一種創造數據的能力,通過創造數據的能力產生更多的數據,不一定是人創造了這些,去把這些東西更多的窮盡出來。在未來,如果在這方面發展的話,可能在增強學習方面,要進行更多的發展和突破。
第二個就是舉一反三,什么叫舉一反三,AlphaGo 下圍棋能下倒世界冠軍,但是他的下棋方法到現在已經不行了。因為他的方法并不是為下棋而創造的,他不會進行推導。當我們驗證大數據和一個非常好的效果的時候,我們數據量很小的時候,怎么把原來的模型遷移過來,這是非常重要的研究方向。
第三個方向和人相比就是歸納總結。人是非常能進行一些總結的,包括像牛頓的第一定律,包括牛頓的萬有引力,都是人總結出來的,包括我們很多公理,但是目前機器學習是沒辦法進行歸納總結的,我們之所以結果好,它并沒有提煉出公理和定律的關系。所以這方面未來我們要在歸納總結,特別是無監督學習上面,分類問題是有目標去學習的,但聚類問題沒有目標的時候,我們怎么把它聚好。
所以在這三個能力上面,我相信這是我們未來在 AI 上面要進行提升的。第二個就是在整個的發展方向上面,剛剛講了很多說機器學習通過數據方法,它從傳統的淺層學習里面,我們所有通過統計學的概率論,完備的統計學概率論理論來支撐它,我們說到求這種函數極限的問題,已有很多完備的數學公式去證明,一定能解決它的問題,但是恰恰在我們機器學習上面,雖然前面我們用了隨機去找局部最優,但是它本身數學領域,它只是一個框架,我們在很多上面還是一個啟發式的約束,包括我們的初始化參數多少,包括我們學習率是多少,這都是有啟發性的。
在未來如果機器學習要繼續往下走的話,我們在數學理論上面一定要有強大的支撐,特別傳統的機器學習,數學完備型,要遷移到我們機器學習上來。
大家知道神經網絡的提出,很多來自于原來的腦神經學科和生物系統,在本身這個上面,我相信未來 AI 的發展要引入更多,不光是我們數學學科、計算機學科,還要引入腦學科神經去引,因為腦的神經結構就是,剛剛我提到了蟬紗神經網,已經連接腦神經的概念了,進行跨層連接,達到一個非常好的效果。
當然更多的東西我希望在未來,在交叉學科上面,包括融合生物、腦神經甚至包括哲學,這樣的話整個 AI 可能才有更多完備型的發展。另外一個地方就是,在當今世界里面,AI 對所有公司來講,對所有人來講都應該是平等的,所以我們一定要開放。比較好的是當今世界所有的,在 AI 領域里面的大公司都在做,包括騰訊也會,我們看到很多包括谷歌、非死book 它也開放了非常多的網絡模型,包括我們了解現在很火的 Open AI 等等這些大的這種機器學習平臺先行者。騰訊在未來也會去進行很多開放,讓更多的人來參與,進行測試。所以整個過程就在未來 AI 的發展,我相信第一方面就是在能力上面,要跟人去匹敵的話,要進行提升。第二個在整個學習的完備型,數學完備,學科完備上要進行豐富。第三個就是所有大公司,應以更加開放的心態去面對 AI,這才是未來 AI,AI 的未來。
中國的 AI 實力不亞于美國
說到這里我又要再次強調一下,AI 對騰訊來講非常重要,對中國整個互聯網都很重要。
在互聯網時代,我們跟美國最強的公司去比,還會有一些差距。但在 AI 時代,包括騰訊在內的各大中國公司,是完全跟世界一流的公司是有匹敵之處的。為什么?
第一我們用戶量大、數據足夠多。
第二是應用場景,作為騰訊來講,我們有很多把 AI 這種遙不可及的技術跟落地的機會,我們可以在微信、游戲、新聞、QQ 里面去落地 AI 場景。哪怕小到一點語音識別、圖像、聊天機器人等等,這都是我們可以去落地的地方。
第三個地方就是人才。目前機器學習領域的華人是非常多的,我參加過 2016 年的 ICML,有三千人,我敢說大概 30-40% 的人都是華人。其中 40% 的文章都是華人寫出來的。人才結構上中國是有非常好的這種人才的基礎,說正是基于我們數據的優勢,我們場景落地的優勢,我們人才結構的優勢,我覺得在騰訊也好,中國其它互聯網對 AI 的未來大有可為。最后講一下騰訊的 AI 使命。我們的 AI 使命,讓 AI 無所不在。
來自: 雷鋒網