Mozilla “Common Voice” 開源語音識別項目

jopen 7年前發布 | 15K 次閱讀 Mozilla

Mozilla “Common Voice” 開源語音識別項目

英文原文: Project Common Voice

語音識別技術可能會徹底改變我們與機器的交互方式,但通常技術開發代價昂貴,而且有專利上的使用限制。大多數語音識別技術都被封鎖在少數的大公司內。Mozilla 認為這樣會阻礙創新,因此它發起了“Common Voice”這一開源語音識別項目。

在“Common Voice”項目中,你可以捐獻語音到一個大型數據庫里,這些語音會被用于構建開源的語音識別引擎,任何人都可以訪問這些數據從而輕松又快速地訓練基于語音的應用程序。通過“Common Voice”,程序員們可以開發很多有趣的應用程序,如實時語音翻譯、基于語音的管理助手等等。用戶也可以幫助驗證語音,根據顯示的文本判斷聽到的語音是否正確,該判斷結果也會被用于改進語音識別模型。

Mozilla 計劃從 2017 年六月份開始收集總時長約 10,000 個小時的語音(這是訓練一個語音文本轉換系統所需要的數據量),之后會開源語音數據庫。目前的源文本來自人們的捐獻,以及一些公開的電影劇本,如電影“風云人物”(It's a Wonderful Life)。考慮到實際生活中人們的語音變化多樣,Mozilla 希望能收集到多樣化的語音,讓語音識別引擎能夠準確無誤地處理不同場景下的語音,比如帶有背景對話聲、汽車噪音、風扇噪音的場景。在將來,Mozilla 有可能會將該語音識別引擎集成到 Firefox 中。

該項目在 Github 上的鏈接:https://github.com/mozilla/voice-web

來自: InfoQ

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!