暗戰中文版Siri 騰訊曲線加入

fmms 12年前發布 | 14K 次閱讀 騰訊

盡管此前蘋果官網上曾表示,Siri 將在 2012 年支持中文,但在其最新推出的 New pad 中,并未出現 Siri 的身影,不過,這并未影響參考蘋果公司進行互聯網布局的中國互聯網巨頭有所行動——大舉布局中文版 Siri,與其相伴的挖角行動也隨之展開。

小i機器人創始人袁輝向本報表示,目前搶著做中文版 Siri 研究的公司主要有三類,第一類公司是以安徽科大訊飛信息科技股份有限公司(下稱“訊飛”)為首的語音公司;第二類公司,以 iPhone 客戶端開發、安卓客戶端開發的團隊;第三類是曾經做過機器人、語義分析的一類公司,如小i機器人。

“據我了解到的情況來看,目前各大互聯網巨頭也都在布局中文版‘Siri’,在語音語義兩個方面都在進行各自的研究,預計半年左右的時間,都將會有新產品面世。”一名從事該領域研究的互聯網公司人士向本報表示。

挖角

據一位曾就職訊飛的員工透露,從 2011 年底到 2012 年初,合肥世紀訊微科技有限公司(下稱“訊微”)陸續從訊飛挖走了幾十人。不過,訊微及騰訊公司均未對此事作出回應。據了解,2011年 1 月訊微是由騰訊斥資 2 億元投資所成立的子公司。

已在該領域經營十載的訊飛,自然知道人才的重要性,從 2011 年底到 2012 年初,訊飛提高了相關工作人員的工資,漲幅超過一倍。一個有意思的細節是,“合肥訊微的第一次招工,時間定在一個周六,這天科大訊飛本來是放假,但是管理層選擇了全體加班,以應對訊微的挖角。”上述人士稱。“這些被挖角的人,此前在訊飛做語音產品的測試工作,來訊微后主要做手機游戲的測試,這次的挖角行動,并沒有帶走訊飛的核心技術人員。”一位不愿具名的訊微員工稱。就目前訊微在其官方網站上發布的產品頁面數據來看,目前訊微主要是在游戲領域發力。

布局中文版 Siri

“以前我們說語音技術還要解釋半天,Siri 無形中教育和引導了這個市場,訊飛是其中之一的受益者。”訊飛副總裁徐景明說,由于中文版 Siri 概念的炒作,半年來其股價已經由去年 10 月的 29 元,上漲近 30% 至 38 元。在個人用戶領域,訊飛目前推出了頗受用戶歡迎的訊飛口訊、訊飛語點、訊飛語音輸入法等產品。由此受益的還有專注于人工智能的小i機器人。其創始人袁輝在該領域浮浮沉沉 10 年,致力于將小i機器人打造成中文版 Siri。

與上述兩家公司相比,互聯網巨頭們則低調很多。2009年 12 月,谷歌公司正式推出中文版語音搜索。此后 2011 年年中,百度推出帶有語音搜索功能的手機客戶端“掌上百度”。“百度確實是在這方面有布局,但是目前,我們不方便透露太多。”百度公關部發言人李國訓表示。

騰訊一名內部人士向本報表示,騰訊在語音方面的產品目前主要布局在搜索領域。“在語音交互方面,騰訊的手機瀏覽器、音樂、地圖等都已支持語音搜索功能,語義方面也有研究,后續會有新的產品面市,這塊主要是騰訊搜搜團隊在運作。”

徐景明表示,訊飛和騰訊在無線領域正在進行語音合作,比如移動 QQ、移動搜索等領域,訊飛 2011 年的財報收入中,有 1000 萬來自與騰訊合作的業務。騰訊研究院院長鄭全戰向本報表示,騰訊一直關注語音語義技術的發展,并于一年前在騰訊研究院組建了一個以語音語義為重點研發方向的團隊,“目前研究院推出了一款語音輸入法的產品,與搜搜團隊的產品有時候會有重合的部分。”“Siri 創始人對 Siri 新的定義是,20% 的語音識別,即 Siri 能將語音轉化成文字;加上 80% 的網絡機器人,即能理解你的意思(語義),并做出反應。”袁輝解釋道,“訊飛一直在做的事情是 20% 的內容,即語音識別;小i機器人一直在做的是 80% 的內容,而目前的難點還是在 80% 上面。”

據一位業內公司高管透露,騰訊實際上是在做整個自己的 Siri,語音只是一個部分,語義也在研究。“騰訊一定會將 Siri 作為一個重點關注的方向,但是目前人不多,就是研究院的人在做,差不多幾十個人。”

“語義”難

“蘋果目前推出的 Siri 產品,是一款人工智能產品加上 Nuance 語音識別功能的融合。所以訊飛真正要定位只能定位中國的 Nuance,而不是中國的 Siri。”袁輝表示,小i機器人正在尋求與 Nuance 等語音公司進行合作。徐景明向本報表示,語義方面是要一個長期積累的過程,訊飛目前也還在持續投入。

但語義方面,正是目前的難點。語義需要機器人對輸入的語境進行判斷。舉個簡單的例子,當用戶詢問機器人:“今天北京的天氣怎樣?”它回答:“晴朗。”用戶再詢問,“上海呢?”機器人能結合上下文的語境,判斷用戶問的問題是上海的天氣,并作出回答。

“人工智能一定是人工加智能,需要通過海量信息的搜集,以及整個網絡知識結構的沉淀,需要不斷地對機器人進行訓練。在這個過程中,人工一定要參與,這也是為什么蘋果在印度招工程師整理知識庫的原因。”袁輝表示。

人工智能,第一步要通過算法模擬人類思維理解人類在講什么,需要不斷地檢驗這個算法是好還是壞;第二步,得有一個成長的知識庫系統,讓字節經過整理變成數據,數據經過整理能變成信息。而這些正是做語音交互要攻克的難點,目前 Siri 功能的不完善,亦讓蘋果公司飽受非議。

據《華爾街日報》報道,今年 3 月份,蘋果公司就陷入了與一名 iPhone 4S 用戶的法律糾紛之中,原因是一名叫做 Frank Fazio 的用戶認為,蘋果在為其虛擬個人助理 Siri 所打的廣告當中包含“誤導和欺騙”的性質。亦即 Siri 廣告當中向人們所展示的簡便使用性,并不能在現實生活當中實現。“蘋果在最新的 New iPad 中,都沒有推出 Siri 功能,就是因為他們要對 Siri 的語義部分進一步完善,但是這些都需要長時間的積累,不是一年兩年就能做成的。”袁輝表示。“目前騰訊、百度都是投入比較小型的團隊去做這件事情。主要是因為蘋果在做了,這必定是一個方向,但是還沒有將其放到整個公司戰略層面上來,他們的投入說白了是不夠的。”一名與多家互聯網企業語音交互部門有過密切接觸的人士向本報表示,蘋果投入如此巨大,因為蘋果有非常清晰的短期戰略,但是中國企業現在去做更多的是跟風,且基本上對整個語音交互市場,目前都沒有明確的戰略規劃。

 本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!