Mozilla開源音頻數據庫已成為第二大公開語音數據集

jopen 7年前發布 | 15K 次閱讀 Mozilla

Mozilla開源音頻數據庫已成為第二大公開語音數據集

Mozilla 的開源音頻數據庫 Common Voice 已收集了來自 20,000 個人的近 40 萬個錄音,整體時間已超過 500 個小時,據稱這是公開發布的第二大語音數據集。

Common Voice 是 Mozilla 今年 7 月推出的一個大型公共數據集,并已開源。它允許用戶通過 iOS 應用或網站捐贈他們的話語,提交他們自己閱讀特定句子的簡短音頻記錄。

Mozilla開源音頻數據庫已成為第二大公開語音數據集

Mozilla 新興技術高級副總裁肖恩·懷特(Sean White)在一篇博客文章中曾表示,“商業上可用的語言服務很少的一個原因是缺乏數據。當我們開始打造語音識別系統時,我們發現我們可以在已有算法的基礎上工作,并在算法方面進行一些創新。但是要想讓語音識別系統真正起作用,數據的策劃,創建和聚合是一個繞不開的挑戰,如果你想做一個新的語音識別系統,你無法找到一個現成的高質量音頻數據集。” 目前,Common Voice 收集的重點是英文,計劃在 2018 年上半年將其擴展到其他語言。

Mozilla開源音頻數據庫已成為第二大公開語音數據集

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!