微軟再出“原聲”翻譯軟件視頻 輕松“說”中文

jopen 12年前發布 | 6K 次閱讀 微軟

  微軟正在研發的一款“原聲”語音翻譯軟件,它能把用戶說的話翻譯成其他語言播放出來,同時保留用戶本身的口音、音色和語調,聽上去就像用戶親口說的一樣。今天,微軟發布了該軟件的最新演示視頻,微軟首席研究官瑞克·拉希德(Rick Rashid)在視頻中利用該軟件大秀還算標準的中國普通話。

  這段長度 10 分鐘左右的視頻非常值得一看,軟件幫拉希德“不用學就現賣”的普通話雖然難免還是有點別扭,但并不妨礙我們聽懂大概的意思,而且聽上去真的很像拉希德本人說的。拉希德表示,該軟件的強大翻譯能力離不開微軟采集的海量數據,而他在使用該軟件之前需要花費 1 小時對它進行訓練,也就是為自己的語音建模。

投遞人 itwriter 發布于 2012-11-09 17:22 評論(8) 有672人閱讀  原文鏈接  [收藏]  ? ?

  微軟正在研發的一款“原聲”語音翻譯軟件,它能把用戶說的話翻譯成其他語言播放出來,同時保留用戶本身的口音、音色和語調,聽上去就像用戶親口說的一樣。今天,微軟發布了該軟件的最新演示視頻,微軟首席研究官瑞克·拉希德(Rick Rashid)在視頻中利用該軟件大秀還算標準的中國普通話。

  這段長度 10 分鐘左右的視頻非常值得一看,軟件幫拉希德“不用學就現賣”的普通話雖然難免還是有點別扭,但并不妨礙我們聽懂大概的意思,而且聽上去真的很像拉希德本人說的。拉希德表示,該軟件的強大翻譯能力離不開微軟采集的海量數據,而他在使用該軟件之前需要花費 1 小時對它進行訓練,也就是為自己的語音建模。

  那么該軟件的核心技術又是什么呢?拉希德透露稱:

  “在兩年前,微軟研究院和多倫多大學的研究人員們取得了一項突破,利用模擬人腦行為的‘深度神經網絡(Deep Neural Networks)’技術,能讓語音識別器更具辨別能力,其性能優于以往的方法。

  ……我們讓語音識別的錯詞率比以往的方法降低了 30%,也就是說以前是每4.、5個詞里有一個不正確的,而現在每7、8個詞里才有 1 個。”

  這段視頻想必會引起眾多華人的興趣,但是這里有個小插曲:微軟之所以選擇演示“英譯漢”,倒未必是刻意迎合華人,而很可能與它的開發者有關——負責實時語音翻譯軟件研發的微軟研究院語音組主管宋歌平(Frank Soong)正是一位華人。

來自: 搜狐IT

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!