谷歌翻譯研發科學家高勤:利用機器學習消除語言障礙

jopen 7年前發布 | 12K 次閱讀 Google

谷歌翻譯研發科學家高勤:利用機器學習消除語言障礙

7 月 11 日上午,2017(第 16 屆)中國互聯網大會在北京國家會議中心開幕。谷歌翻譯研發科學家高勤在會上進行了演講并總結了谷歌翻譯最近一年取得的進展,著重對神經網絡機器翻譯技術作了深度的解析。

高勤指出,經過 11 年的發展,谷歌翻譯已經成為一個全球性的產品,月度活躍用戶超過 10 億人次,其中 95% 來自于美國以外地區。翻譯質量一直是谷歌翻譯所關注的焦點,最近一年以來,因為使用了神經網絡機器翻譯技術,谷歌翻譯的質量有了顯著的提升。

神經網絡相對于傳統技術是一種革命性的改變。基于短語的統計機器翻譯是拼圖過程,通過對短語對的排列和組合,嘗試找出較好的翻譯選項,但整個決策過程是離散的、這個決策的信息也都是局部的。神經網絡機器學習反其道而行之,使整個決策過程既是連續的也是全局的。

神經網絡機器翻譯相對傳統技術的巨大優勢,對于詞根距離非常長的英文單詞來說,傳統機器翻譯技術和難解決。英語復雜程序結構帶來了很多調序以及省略,如果不能夠利用整個云語言句子全局信息,就可能會得到一種不連續、不自然、不準確的結果。而神經網絡機器翻譯在這兩方面都有了長足進步。

神經網絡雖然擁有強大的表達能力,但也需要極大的計算量。谷歌張量處理器的誕生解決了這一問題,也使得提供快速的翻譯服務成為可能。

高勤最后提到,雖然神經網絡機器被反復提及和研究,但這并不代表著神經網絡機器翻譯已經非常成熟,事實上我們對神經網絡機器翻譯的認識仍然非常膚淺。下一步,我們將繼續致力于改進數字、日期、姓名、品牌以及不常見短語翻譯,同時進一步研究新的模型結構與訓練方法。

來自: 騰訊科技

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!