揭秘非死book語音識別項目 蘊含無限可能和機遇

jopen 6年前發布 | 20K 次閱讀 Facebook

揭秘非死book語音識別項目 蘊含無限可能和機遇

8 月 23 日消息,據外媒報道,非死book 加入語音計算革命大潮的速度有點兒慢。它還沒有自己的語音助手,智能音箱仍在開發中,Instagram 等諸多應用程序也沒有完全集成音頻通信功能。但從 非死book 代碼中發現的線索以及新的專利申請來看,這一狀況將發生很大變化。

開發語音功能可以讓人們在家里或在旅途中使用 非死book 的方式更多。據報道,非死book 即將推出的 Portal 智能音箱是專為方便與遠方家人視頻聊天而設計的,這些家人包括使用智能手機不便的老人和孩子。改進后的轉錄和語音-文本-語音功能可以讓 Messenger 用戶通過輸入媒介連接起來,并讓他們始終保持在聊天應用上,而不是返回到 SMS。

但如果 非死book 不盡快行動起來,它的語音項目可能會被競爭對手的喧囂淹沒。所有主要的移動硬件和操作系統制造商現在都有自己的語音助手,如蘋果的 Siri、亞馬遜的 Alexa、谷歌的 Assistant 以及三星 Bixby,他們都在自家智能音箱上集成了語音助手。

揭秘非死book語音識別項目 蘊含無限可能和機遇

2018 年第二季度,全球智能音箱出貨數據

市場研究機構 Canalys 估計,在 2018 年第二季度,Google Home 的出貨量為 540 萬部,亞馬遜 Echo 的出貨量為 410 萬部。而 Strategy Analytics 的數據顯示,蘋果 HomePod 起步緩慢,所占市場份額不到6%,依然落后于阿里巴巴的智能音箱。鑒于 非死book 在隱私問題上的糟糕記錄,可能導致潛在客戶轉投競爭對手。

考慮到 非死book 在語音計算革命中已經落后,它需要強大的工具來解決真正的問題。下面我們來看看 非死book 在語音領域取得的最新發展,以及它過去的實驗如何為下一次飛躍奠定了基礎。

Aloha

非死book 正在開發自己的語音識別功能,名為 Aloha,它適用于 非死book 和 Messenger 應用,同時也適用于外部硬件,比如其正在開發的視頻聊天智能音箱。獨立應用程序研究員 Jane Manchun Wong 挖掘出來的 非死book 和 Messenger Android 應用代碼,首次展示了 Aloha 用戶界面的原型。

它的標簽為“Aloha 語音測試”(Aloha Voice Testing),當用戶在消息線程中說話時,一個水平的藍色條會展開并收縮,以在識別和轉錄文本的同時顯示語音的音量。這段代碼描述了該功能可與外部 Wi-Fi 或藍牙設備連接。這款軟件有可能同時在 非死book 的硬件和軟件上運行,類似于 Google Assistant,它可以在手機和 Google Home 智能音箱上運行。

非死book 拒絕對這段視頻發表評論,但其發言人表示:“我們始終在測試些新東西,今天沒有什么要分享的,但我的團隊幾周后會聯系 AR/VR 網站發布有關硬件方面的新聞。”目前還不清楚“硬件新聞”是否會集中在語音和 Aloha 或 Portal 上,或者僅僅是與 非死book 9 月 25 日舉行的 Oculus Connect 5 發布會有關。

知情人士此前曾表示,多年前,非死book 有意開發自己的語音識別軟件,專門用于準確記錄朋友之間的交談方式。與我們正式稱呼像亞馬遜 Alexa 或 Google Home 這樣的電腦化助手相比,非死book 的語音模式通常更隨意、口語化、快速且充滿俚語。

Jane Manchun Wong 還在 非死book 的代碼中發現了 Aloha 的 logo,該代碼以火山圖像為特色。現在可以確認,有人曾在 非死book 員工的手機上看到過有類似 logo 的 非死book Aloha Setup 聊天機器人。

如果 非死book 能夠解決這個問題,它可以在 Messenger 和網站的其他地方提供自己的轉錄功能,這樣用戶就可以跨媒介進行交流。它可能會讓你在忙得不可開交或看不清屏幕時,向朋友口授評論或信息。然后,收件人可以閱讀文本,而不必去聽語音信息。該功能還可以用于為 非死book 應用程序的語音導航提供動力,從而更好地支持免提功能。

音箱與攝像頭專利

2017 年 8 月份有報道稱,非死book 的視頻聊天智能音箱最初代號是 Aloha,后來更名為 Portal。這款售價 499 美元的亞馬遜 Echo Show 競爭對手最初定于今年 5 月份在 非死book 開發者大會 F8 上推出。但彭博社報道稱,由于擔心此舉會加劇劍橋分析公司(Cambridge Analytica)引發的隱私丑聞,該產品被推遲上市。

揭秘非死book語音識別項目 蘊含無限可能和機遇

非死book 獲得的智能音箱專利

一項新的專利申請顯示,非死book 早在 2016 年 12 月 26 日為一種立方體形狀的設備申請專利時,就在考慮打造智能音箱。專利描述了由巴貝克·埃爾米赫(Baback Elmieh)、亞歷山大·賈斯(Alexandre Jais)以及約翰·普羅科什-韋利(John Proksch-Whaley)發明的“音箱裝置”。同年 9 月,非死book 收購了埃爾米赫的初創公司 Nascent Objects,他現在是 非死book 秘密建筑硬件實驗室的技術項目負責人。

這家初創公司始終在打造模塊化硬件,今年早些時候,埃爾米赫在 非死book 的幾個模塊化攝像頭項目獲得了專利。非死book 一直在開發的音箱和攝像頭技術可能會演變成視頻聊天音箱。事實上,非死book 已經探索智能音箱技術很長時間了,而且這些專利的發明者仍在硬件實驗室研究秘密項目,這強化了 非死book 在語音領域有宏偉計劃的觀點。

揭秘非死book語音識別項目 蘊含無限可能和機遇

非死book 獲得的專利顯示相機(左)和視頻攝像頭設計

Instagram 語音信息

最后,Instagram 也在向語音領域進軍。Jane Manchun Wong 從 Instagram 的 Android 應用程序代碼中生成的截圖顯示,非死book 顯然在開發語音短信功能 Instagram Direct。這將允許你在 Instagram 上發聲,并發送類似于步話機的音頻片段,或早在 2013 年添加的 非死book Messenger 語音信息功能。

你可以在屏幕底部的信息編排器中看到語音按鈕,代碼解釋說“語音信息,按下并保持記錄”。這款原型機是在 Instagram Direct 最近推出視頻聊天功能后亮相的,也是通過 Jane Manchun Wong 的研究發現的另一個功能。Instagram 發言人拒絕置評,因為尚未公開測試的新功能在代碼中被發現,他們就沒什么可分享的了。

漫長的探索之路

長期以來,非死book 始終在語音領域徘徊。2015 年,非死book 收購了自然語言處理初創企業 Wit.ai。這家公司運行著開發者平臺,用于構建語音接口。不過后來,非死book 將 Wit.ai 并入到 Messenger 平臺團隊中,專注于開發聊天機器人。

非死book 還在 2015 年開始測試自動將 Messenger 語音片段轉錄為文本的功能,這可能是上述 Aloha 功能的基礎。該公司還透露,其個人助理M可以為用戶完成任務,但它只是在非常有限的用戶基礎上推出,后來被關閉。

2016 年,非死book 的 Messenger 主管大衛·馬庫斯(David Marcus)聲稱,語音”并不是我們現在積極開發的工作”。但他補充道:“在某種程度上,隨著我們在 Messenger 中開發越來越多的功能和交互,我們將開始研發語音交流和接口。”然而,消息人士透露,非死book 的秘密預言技術團隊已經在探索語音機會。非死book 還開始為那些只想播放聲音而不是視頻的用戶測試其實時音頻功能。

揭秘非死book語音識別項目 蘊含無限可能和機遇

非死book 從未放棄過語音識別努力

到 2017 年,非死book 為網頁視頻提供了自動字幕,并開發了語音搜索功能。今年,非死book 開始嘗試將語音片段作為狀態更新和 Stories,供世界各地可能無法用母語打字的用戶使用。但高管們并沒有過多談及語音計劃。

非死book 設計總監盧克·伍茲(Luke Woods)曾在 2017 年表示:“語音搜索非常有前途,有很多令人興奮的事情發生。我喜歡能和汽車對話,讓它導航到特定的地方。這是許多潛在用例之一。這也是聲音轉錄可以提供幫助的領域之一。”

目前還不清楚 非死book 的 Aloha 到底會變成什么樣子。它可能是 非死book 智能音箱和應用的實際操作系統或語音界面及轉錄功能,也可能會成為像M那樣功能更完備的語音助手,但也支持音頻。或者,它可能成為 非死book 通往其他語音生態系統的橋梁,充當 非死book 的 Alexa Skill 或 Google Assistant Action。

來自: 騰訊科技

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!