微軟發布知識圖譜和Concept Tagging模型 幫助機器更好地理解人類
當我們在討論人工智能時,請注意,我們通常在討論弱人工智能。
雖然我們現有的資源與之前可謂不同日而語——部署在云端的海量計算資源已經像水和電一樣唾手可得了;互聯網所容納的信息也遠遠超過了過去幾千年來人們所有的知識儲備;以深度學習等為代表的機器學習算法的發展,也讓計算機能夠從這些龐大的數據中獲取知識。
但是我們也不得不正視一些事實,當前的人工智能更多的是針對某個具體的問題,發展對應的算法和技術,有人稱之為“拼圖式”的工作方法:我們做出了視覺模塊、再拼上語音模塊、推理模塊——把每個子領域的功能做好,然后再組合出一個完整的智能系統出來。
微軟一直在為這份屬于全人類的人工智能大拼圖貢獻力量。從底層的可編程芯片 FPGA,到 Azure 云平臺的部署,從微軟認知工具包(Microsoft Cognitive Toolkit),到應用層面的能供每一個沒有人工智能背景也能開發出屬于自己的智能應用的微軟認知服務……隨著人工智能拼圖不斷趨于完整,科學家們始終會問自己:計算機真的能像人類一樣智能了嗎?
今天,我們很高興地宣布,微軟亞洲研究院正式發布 Microsoft Concept Graph 知識圖譜和 Microsoft Concept Tagging 模型,用于幫助機器更好地理解人類交流并且進行語義計算。Microsoft Concept Graph 是一個大型的知識圖譜系統。其包含的知識來自于數以億計的網頁和數年積累的搜索日志,可以為機器提供文本理解的常識性知識。(了解更多信息,請訪問 https://concept.research.microsoft.com/)
Apple 是什么
10 月初,你的微博、微信可能都被一首叫《PPAP》的神曲占領了。什么,你還沒聽過?那讓我們先來看看這首曲子:
這首歌是有日本諧星古坂和仁(PIKO 太郎)于 8 月 25 日發布在 油Tube 上的,一開在日本小范圍內炒紅;后來由新媒體 9GAG 發布,其瀏覽數據立馬飆升。9 月 25 日,9GAG 在 非死book 上傳了 PPAP,被大V轉發以后,迅速火起來。目前,這個視頻的播放量已經過億,并且榮登美國公告牌單曲榜 Hot 100。能登陸 Hot 100 是個什么概念呢?對于亞洲歌曲上榜歷史數據來說,最近的一次,是 2012 年鳥叔的 《江南 Style》蟬聯了 7 周亞軍的位置。
這首魔性的神曲的歌詞非常簡單易學:“I have a pen. I have an apple. Apple-pen!”
小編為什么要把這個魔性的神曲分享給大家呢?下面問題來了:當 PIKO 太郎說出“I have an apple.”時,你第一反應這個“apple”是一種水果,還是一家公司?
你也許會意識到,很多時候幫助你做出判斷的并不是一些能夠清晰列在書本的知識,而是大量常識性的概念。例如“筆是一種寫字的工具”、 “筆是豎直形的可以捏在手里”、“蘋果是一種水果或一家公司”等等概念,都有助于我們對歌詞的判斷和理解。
當下,計算機究竟有多智能了?它可能能輕而易舉的戰勝一個三四十歲經驗豐富的世界頂尖棋手,但是它的學習能力以及完成一般任務的能力可能都遠不及一個三四歲的孩童。研究員們從人類的學習成長過程開始入手,試圖找到逐步實現機器智能的解決方法。
這個問題的答案可能是“常識”——理解是萬物的基礎。人們在正式上小學、初中接受系統性教育開始,已經早早地開始了學習的過程。這種與生俱來的本能能讓你進入小學之前已經了解諸如“糖是甜的食品”、“水是一種液體”這一類基礎的概念,并且隨著年齡的增長,這種并不屬于某個專業領域的開放性常識也在人們的認知中日積月累,并不斷豐富。
微軟亞洲研究院今天發布的 Microsoft Concept Graph 就在試圖讓計算機復制這些常識性概念,其核心知識庫包含了超過 540 萬條概念。除了包含一些被絕大部分通用知識庫包含的概念,例如“城市”、“音樂家”等,Microsoft Concept Graph 還包含數百萬長尾概念,例如“抗帕金森治療”、“名人婚紗設計師”、“基礎的水彩技巧”等,而這些概念在其他的數據庫中很難被找到。除了概念,Microsoft Concept Graph 同樣包含了大量數據空間(每條知識概念都包含一系列的實體或者子概念,例如“太陽系”底下可能就會包括“水星”、“火星”、“地球”等等)。
Apple 是甜的
當你看到“Apple 是甜的”這句話時,你幾乎可以肯定這里的“Apple”指的是我們最常見的那種水果。在這幾毫秒的時間里,你觸發的是“根據上下文語境確定語義”這一技能。微軟亞洲研究院的研究員們同樣也為計算機點亮了這棵技能樹。
Microsoft Concept Tagging 模型可以將文本詞條實體映射到不同的語義概念,并根據實體文本內容被標記上相應的概率標簽。例如“微軟”這個詞可以被自動映射到“軟件公司”和“科技巨頭”等概念,并帶有相應的概率標簽。這個模型讓計算機擁有常識性的計算能力,讓機器“了解”人類的意識,從而讓機器可以更好地理解人類的文本交流。具體來說,概念模型根據人類的概念推理將實體或者短語映射到大量自動習得的概念空間(向量空間)。這種映射關系是人類和機器都可以理解的。因此該模型提供了文本理解所需的文本概念映射、短語語義化理解等功能。
Microsoft Concept Tagging 模型區別于以往常見的文本推理模型的根本區別是他是基于網絡之上的一個推理模型,將文本映射到一個顯式的知識空間,將文本概念化。以搜索引擎為例,絕大多數的用戶的查詢詞數量是很少的,搜索引擎在返回結果時需要將查詢詞進行額外的信息化,將很短的文本映射到大量的概念空間里面,從而解釋了這一段文本。傳統的模型對于文本的推理幾乎不可解釋,而 Microsoft Concept Tagging 模型用不同的概念去描述一個詞,并給出對應的概率,使機器能夠更好地理解文本,另一方面可計算的顯性詞向量也體現了我們人類智能與人工智能相結合的理念(HI+AI,human in the loop)。例如社交網絡的設置中,工程師可能會人為設置一些關鍵字去屏蔽一些不當言論,但是并不是每一個敏感詞工程師都能準確找到。例如工程師屏蔽了“希特勒”、“納粹”,卻忽略了“法西斯”,現在 Microsoft Concept Tagging 模型就能對已有的概念進行延展,在系統中找到其他類似的相關性很大的關鍵字,做更多智能的擴展。
理解是萬事萬物的基礎
“我們想做的,是讓計算機能夠更好地理解人類。”現負責 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的微軟亞洲研究院資深研究經理閆峻博士說,“理解是萬事萬物的基礎,我們用計算機抓取過去這些不成文的開放領域的常識,能夠幫助計算機更具象地了解這個世界。”
圖(從左至右)為微軟亞洲研究院研究員紀蕾,資深研究經理閆峻,研究員張大衛
對于這類知識圖譜,學術界和工業界都有參與,但始終離不開一些根本問題:如何去獲取實體、實體和實體之間的屬性和關聯。在過去,知識庫系統和人類的思考方式差異巨大。例如“奧巴馬生日”,過去計算機能理解這個詞的含義,但是卻不能直接給你回答,而此次微軟開放的 Microsoft Concept Graph 和 Microsoft ConceptTagging 模型就希望能為人們提供一個更智能化知識圖譜,借助它,從實體到抽象概念,計算機都能夠理解。
談及 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的下一步計劃,閆峻博士表示目前該模型暫只能支持英文,還要和高校合作完成中文的支持工作。在完成中文的知識庫構建之后,再逐步擴展到多語言版本。其次,人類的語言還涉及到比喻、夸張和玩笑等高層次跨領域的抽象表達方法,這也是接下來需要讓機器不斷學習的方向。最后,從短文本的理解到長文本的理解,如理解兩個完全不同的故事,但語義層面在表達同樣的道理,也是他們接下來不斷努力的方向。
Microsoft Concept Graph 和 Microsoft Concept Tagging 模型可以應用于不同的文本處理應用,包括搜索引擎、自動問答系統、在線廣告系統、推薦引擎、聊天機器人、以及人工智能系統等。目前這個模型已經進入了微軟的多個產品和服務中。微軟亞洲研究院高級研究經理閆峻博士表示:“我們希望 Microsoft Concept Graph 和 Microsoft Concept Tagging 模型的發布可以推動知識挖掘、自然語言處理等領域的發展,最終推動人工智能的進步。”
來自: 微軟研究院AI頭條公眾號