Mozilla開源音頻數據庫已成為第二大公開語音數據集

jopen 8年前發布 | 15K 次閱讀 Mozilla

Mozilla 的開源音頻數據庫 Common Voice 已收集了來自 20,000 個人的近 40 萬個錄音，整體時間已超過 500 個小時，據稱這是公開發布的第二大語音數據集。

Common Voice 是 Mozilla 今年 7 月推出的一個大型公共數據集，并已開源。它允許用戶通過 iOS 應用或網站捐贈他們的話語，提交他們自己閱讀特定句子的簡短音頻記錄。

Mozilla 新興技術高級副總裁肖恩·懷特（Sean White）在一篇博客文章中曾表示，“商業上可用的語言服務很少的一個原因是缺乏數據。當我們開始打造語音識別系統時，我們發現我們可以在已有算法的基礎上工作，并在算法方面進行一些創新。但是要想讓語音識別系統真正起作用，數據的策劃，創建和聚合是一個繞不開的挑戰，如果你想做一個新的語音識別系統，你無法找到一個現成的高質量音頻數據集。” 目前，Common Voice 收集的重點是英文，計劃在 2018 年上半年將其擴展到其他語言。

Mozilla開源音頻數據庫已成為第二大公開語音數據集

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/news/view/1cf4adaf

Mozilla

Mozilla開源音頻數據庫已成為第二大公開語音數據集

相關資訊

相關經驗

相關文檔