傳說中的新版Google翻譯到底有多厲害?

jopen 10年前發布 | 7K 次閱讀 Google

原文  http://www.pingwest.com/how-dope-is-the-new-google-translate/

上周末, 紐約時報的一篇有關于語言翻譯技術進步的報道 ,讓許多人為科技發展的速度之快所震撼:該報道指出, Google多年沒有過大變化的翻譯(Google Translate)服務,即將迎來一次大功能更新,將可以聆聽并識別用戶所講的語言,然后幾乎實時地將語音翻譯為目標語言的文字。 這個功能聽上去十分強大,看起來Google的自然語言處理和機器翻譯技術已經發展的足夠好,估計可以讓不少翻譯和同聲傳譯員工丟掉工作了。

Google翻譯是目前全世界最多人使用的翻譯產品,支持90種語言之間的互相翻譯,包括了阿拉伯語、英語、法語、德語、漢語、西班牙語等在內的 所有熱門語種。紐約時報的報道顯示,web、iOS和Android等各平臺上的月活躍用戶已經超過了5億,僅Android版Google翻譯應用的下 載安裝量(這是一款非預裝應用)就已經高達1億。

在機器翻譯的領域內主要由三種大層面上的翻譯技術門類,分別為“基于規則”(rule-based)、“基于統計”(statistical- based)和混合。其中,Google屬于“基于統計”,可以通過用戶直接搜索的翻譯結果、對網頁內容的抓取翻譯等多種不同的渠道獲取大量的語料資源用 于深度學習,從而逐漸獲得一種明白兩種語言的文字之間如何匹配的能力,并且將這種能力作為服務提供給用戶。

顯然,這次Google翻譯的服務水平又上了一個等級。如果你把你已經安裝了Google翻譯的手機看做是一個人的話,其實ta已經變成一個翻譯 效率相當高的電子翻譯官了。不過,Google翻譯給很多人的印象之前一直不怎么好,比如那些出現在交通標志上、超市甚至廁所里的令人啼笑皆非的翻譯,就 經常被吐槽為“Google機翻”的結果。人們不由得感嘆:Google這么厲害的一家公司,連個機翻都搞不好嗎?

fuckgood

一位前Google翻譯團隊科學家告訴 PingWest品玩 ,Google這個即將發布的新版翻譯產品,其背后所需要的研發遠比想象的復雜。

過去的Google翻譯的功能背后的主要技術是機器翻譯(Machine Translation),后來隨著Android以及iOS操作系統功能的進步,在移動端支持了語音輸入,這又引入了語音識別(Speech Recognition)。“機器翻譯和語音識別從技術層面上是單獨的產品,背后都會用到很多自然語言處理(Natural Language Processing,NLP),‘深度學習’的基本技術。”這位專家表示。

專家認為,從目前媒體報道和行業了解的信息來看,新的Google翻譯是一個將機器翻譯和語音識別整合起來的產品,“從技術層面,Google應 該早就有能力推出這種功能了(編者注:指語音識別并實時翻譯),但是拖到現在才出來,可能會有一些其他的考慮。總的來說,兩大技術集成起來需要做大量的優 化,而不是簡單地拼湊起來。”

也即意味著,新版Google翻譯是Google的機器翻譯技術和語音識別技術進行了系統性的整合之后投產的結果,將能夠代表Google在自然語言處理 方面的深度學習所取得的進展,以及其商業化能力。前述的前Google科學家指出,Google的翻譯技術在他在職期間(兩年前)就已經處在業界領先水 平。而這兩年以來Google在深度學習方面的進展一直十分突出,因此有理由(比較穩妥地)相信,Google基于深度學習提供的翻譯服務,其背后的技術 依然可以代表業界的最高水準。

當然,人們對于Google翻譯的技術到底有多厲害可能并沒有多少感知——他們能夠感知到的,其實是不要把干貨翻譯成f**k good就好。

</div>

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!