王小川:搜狗的前生今世

jopen 9年前發布 | 23K 次閱讀 搜狗

今天我來為大家分享的是:跨度十年的“搜狗輸入法”的來世今生,關于它的現狀、緣起、爆發、渠道推廣,以及中間的意外(與 google 的意外摩擦)、產品內涵、商業化思考和未來展望。這里面有從 0 到 1 的過程,也有從 1 到2、從 2 到 3 的過程。

王小川:搜狗的前生今世

大家都知道,互聯網正經歷從 PC 時代到移動互聯網時代,正如以前我們走出去的時候,大家會說:“誒,你是做互聯網的,我是傳統行業的。”那時候,聽著覺得蠻驕傲的。再后來,大家談到互聯 網,是這么說的:“誒,你是做互聯網的。”或者說:“你是做傳統互聯網的,我們是做移動互聯網的。”在這中間,我感覺自己經歷了互聯網的史前文明到泡沫化 的過程。

2006 年 6 月 5 號“搜狗輸入法”上線,差不多經歷了十年,十年歷程非常長,今天就從輸入法展開。

目前“搜狗輸入法”的最新研究是完成搜狗輸入法與智能硬件的結合,最大的突破不在于輸入體驗,而是用想象力推動產品的創新。從這件事情之后,我 們發現互聯網開始以我們為開頭,像百度也開始干了這些類似的事。我們以前“做得少,說得少”,或者是“做得多,說得少”。現在呢,我們是開始干,就想到很 遠未來的事情了。

一、產品現狀

王小川:搜狗的前生今世

先給大家看下,“搜狗輸入法”今天的現狀。給大家看一下艾瑞第一季度的數據,首先,在 PC 端上,“搜狗輸入法”僅次于 QQ 的用戶量,且覆蓋面最高。而移動端上,微信、QQ 名列第一、第二,搜狗占第三,雖然排第三,膽與用戶量最高的微信差距一倍多,為什么呢?其實是被蘋果坑了一把,蘋果 IOS 系統去年才開放了除自帶系統外的別的輸入法安裝,而那時很多人已經適應了蘋果自帶的輸入法。

王小川:搜狗的前生今世

從場景上覆蓋,不僅是 PC 端、移動端,甚至凱迪拉克汽車也內置了我們的輸入法。那怎么去理解輸入法?其實就兩件事:表達自己的思想、語言智慧,跟外界溝通;獲得對世界長久的感知。 傳統的表達自我就是拼音輸入,手機端的輸入法里面使用九鍵的用戶大概占 60%;另外一種就是手寫。我們可以看到,“搜狗輸入法”每天打出來的文字有 520 億,這個數據大概等于 7.2 萬的《紅樓夢》。未來,我們可以做更多努力。

王小川:搜狗的前生今世

還有“搜狗語音識別”,每天有超過一億次,“搜狗輸入法”是目前中國最大的語音品牌。后來通過第三方去檢測,《重慶郵電大學評估報告》顯示,我們的語言準確率達 96.5%,其實準確率來自于大量數據的優化。

有人和我說“語音輸入”會不會顛覆“文字輸入”?我就問過專家,他說大概一年半前有人問他文字和語音的比例是多少?文字:

語音大概是 3 :

1。我就擔心趨勢會變,但是半年之后,比例還是一致的。我擔心是因為流量因素,可是通過數據分析我們發現,從月初到月末,文字與語音的比例基本是恒定的,到了月末沒流量了,文字和語音一起都沒了,所以與流量沒關系。因此,在人的表達里面,還是以文字為主,語音為輔。

王小川:搜狗的前生今世

表達,就是對世界的感知。除了自我表達以外,還有就是對世界的感知,這部分主要是圖像。在圖像工作里面,我們有些成績可以分享:在上周的比賽 中,我們展示了一個產品“食圖”。當你拍一個吃的圖片后,可以告訴你:這是什么、卡路里多少。我們的產品原型已經做出來了,這就是除了文字之外的表達。

王小川:搜狗的前生今世

還有一個項目,就是手表的滑行輸入,這是我們尋找的別的輸入方案。

二、緣起

我們是怎么想到做“輸入法”這件事的呢?

王小川:搜狗的前生今世

2005 年,恰逢搜狐無線部分被移動帶走了,股票市值大跌,搜狗基本屬于一出生就沒錢的狀態。搜狗引擎發布上線后的一年左右時間,很痛苦,工具條效果不理想。在此 介紹一個人,我們內部稱他為“輸入法之父”,他名叫馬占凱。馬占凱 2005 年來北京,他發現一件事:當你用紫光輸入法的時候,打字比智能 ABC 好很多,但是紫光的詞庫不全。他又發現使用百度搜索引擎時,可以通過輸入拼音搜索出文字來。輸入法有這個空間在,而百度可以解決這個問題,于是他就給百度 提建議說:紫光+百度搜索引擎可以做出很酷的產品。他一共給百度發了五份郵件,得到的答復都是:“謝謝你的建議。”于是馬占凱就來聯系搜狗,這一次,他改 變了策略,不講搜索引擎,只是先說,目前的輸入法有什么改進的地方,并提出了 100 個問題點。我當時就與他產生了互動,于是搜狗就開始做了輸入法。

王小川:搜狗的前生今世

他通過數據分析發現,windows 的下載量幾億次,接下來就是 QQ 和輸入法了,輸入法本身存在一個很大的空間。現在的產品是有痛點的,智能 ABC 一點都不聰明,紫光開始會組詞,這是紫光對智能 ABC 的推陳出新,剩下來就是搜索引擎這件事了。

王小川:搜狗的前生今世

這背后還有些小花絮,當時有幾個最優秀的產品經理是反對這件事。將搜索引擎并到詞庫,程序放到桌面,產品經理認為是不合適的。還有一位資深的產 品經理認為,輸入法的兼容性很難,主流的程序可以,但是很多應用程序不兼容。還有很多…但是那時我們沒有兼聽那么多意見,匆忙就上線了。

王小川:搜狗的前生今世

有高頻需求,有痛點,有解決方法就可以去做這樣一件事情,即便他背后有瑕疵。這就是輸入法背后的故事。

三、爆發與渠道推廣

王小川:搜狗的前生今世

“搜狗輸入法”項目一旦上線之后,就得到了很多好評。試想一下,今天如果有一個軟件讓你能無障礙地跟老外溝通,你會怎樣?這就是當初輸入法好評如潮的原因。輸入法本身的意義就是幫助大家去表達,讓表達速度快一倍。

我們很開心,在搜狐黃金廣告位、導航欄里面推搜狗輸入法。可是,一年時間,我們的市場份額僅僅是2%。這一次事情給我們很大的教訓:之前,我們 認為一款好的產品,往搜狐上一放(那時我們認為搜狐是世界的中心)就應該收獲巨大的份額,但市場打破了我的思路,就跟習慣牛頓經典力學的人突然接受到了量 子力學的理論一樣。

王小川:搜狗的前生今世

當時搜狐有一種觀念,就是“閉關”,認為跟別的網站鏈接,把流量分給別人,流失流量,就跟叛國一樣嚴重。2% 的市場份額讓我們認知到搜狐不是宇宙的中心,

這個系統存在裂痕。

王小川:搜狗的前生今世

后來,我們組建了團隊,琢磨推廣這件事情,我們到華軍、太平洋下載站去打廣告,當然,最重要的渠道是番茄花園,番茄花園是免費為盜版光盤提供母 盤為主營業務。番茄花園創始人跟我打了一個比方,Windows 是收費昂貴的毛坯房,土豪才用,而且還要自己改數法,裝軟件;而番茄花園是精裝房,把基本配套軟件打包了,所以一年有數千萬收入。我們借這個東風與它合 作,使得我們的輸入法在 Windows 覆蓋下去了,所以我們的份額從 2007 年的2% 到 2008 年的 40%,再到 209 年的 70%,這就是我們輸入法借助番茄花園得到的增長。

那個年代跟現在不一樣,今天的網絡特別發達,今天一個好產品可以很多人都知道,而當初,走渠道的廣告力量更重要。我們今天還是認為,如果產品不是革命性的、顛覆性的、非用不可的,渠道還是非常重要,方便大家去下軟件。

這就是輸入法得到的一個寶貴經驗。不管你產品多么好,你要把產品送達到用戶手上去。

王小川:搜狗的前生今世

輸入法給我們一個反思,即便它比別的產品好非常多,也很難在短期內得到份額,那搜索引擎呢?

我們之前受到了兩個理論的影響:

王小川:搜狗的前生今世

第一個理論:有 20% 的用戶會用兩個搜索引擎。

這意味著我們要達到 20% 的份額,但其實因為百度已經做到家喻戶曉,這時候當第一個搜索引擎滿足不了他的時候,用戶才會去使用第二個,20% 的人換第二個搜索引擎。實際上使用我們搜索引擎的份額是2%,而且這2% 的用戶也很難得到滿意的答案,因為百度的搜索引擎已經做得很強大了。

第二個理論:

用戶一般從搜狐首頁搜索欄進入搜狗搜索。

我們認為搜狐本身是一個百貨公司,百貨專柜越多,本身越權威,就是互相成長,可是實際上,他賣的是頻道,而引擎是立即消費的事情,就跟買可樂一樣,我們會去百貨公司買可樂嗎?這是我們在做輸入法的時候明白的道理。

王小川:搜狗的前生今世

我們當時想通過“搜狗輸入法”推出“搜狗引擎”,但這好比買了洗衣機后,結果發現里面裝著 4 聽可樂。我們后來發現,瀏覽器好比冰箱,拉開冰箱,發現里面的可樂是搜狗可樂,即使不是百度可樂,也會喝。于是我們就找到了一種打法,當你用搜狗牌洗衣機 (輸入法),我們送你搜狗牌電冰箱,里面裝著搜狗可樂。

王小川:搜狗的前生今世

因此,我們就進入了瀏覽器的研發。我們當時經歷了蠻艱難的過程。“新型的輸入法、瀏覽器、搜索引擎”構成了信息交互的三個源頭,后來這種方法有兩家公司都在用:360 和獵豹,而且他們更厲害,還可以殺掉你的軟件。

四、與 Google 的意外摩擦

王小川:搜狗的前生今世

講一場意外。2007 年 4 月 4 號,谷歌“拼音輸入法”發布了,它很重視,這是他繼發布谷歌平臺之后的第二場發布會。2 點上線,3 點多我們的設計師反映谷歌“輸入法”抄襲了我們的詞庫,比如我們打錯的詞,以及很多生僻的、一般不會上的詞,谷歌也打得出來。

后來,我們采取的做法就是:我們的人給太平洋網絡的人暴露消息。發布會一結束,太平洋消息也出來了:根據網友反饋,谷歌抄襲了搜狗輸入網詞庫。 于是產生了很多的報道,我們也準備了一系列素材并發起了大量的宣傳攻勢。谷歌一直都沒有應對,直到 5 天之后,他才發表聲明:我們也經過一些網民反饋,發現我們輸入法用了一些網上的數據。后來,雙方開始罵戰,谷歌說自己有專利,可是后面查實 2003 年毫無相關聯專利,之后還花 120 萬雇傭水軍進行網絡口水戰。

網民還反過來質疑我們,說谷歌是技術大拿,應該是搜狗輸入法賊喊捉賊。那時出現大量專題討論這件事情,今天看來,也是很好的破冰事件,天時地利,剛好趕上和谷歌的一場官司。

有幾個經驗和大家分享下:

王小川:搜狗的前生今世

第一,不要神話谷歌的技術萬能;

他的輸入法不夠好,因為任何公司都是有邊界的,我們詞庫方面還有北大中文系的編輯,這也是我們的優勢,同時,谷歌的技術是浙大一個兼職的實習生,而搜狗輸入法的人才非常齊備,這也是他落敗的原因;

第二,和大品牌吵架有利于提升品牌;

一吵架就有一堆人圍觀,易于品牌傳播,現在這種機會越來越少。

第三,機會留給有準備的人;

搜狐在市場上非常彪悍,數據、技術都做得非常透,因此擁有很多優勢,對付谷歌,跟對付紙老虎一樣。

第四,危機公關有三原則:及時、透明、有誠意。

谷歌過了 5 天才發表聲明,錯過了最好的時間,而且谷歌先后改動口徑也缺乏誠懇,違背了“透明且統一口徑”的原則。

五、搜狗輸入法的產品內涵

輸入法的智慧、語法、詞品都來自于互聯網,所以,以互聯網的眼光,讓打字更省力,能少打一個字是一個字,以情景化的智慧來解決輸入的問題,實際上這也是技術實力的展現。

王小川:搜狗的前生今世

我們做了很關鍵的一件事,就是云端,云輸入法有什么好處呢?云端查詢云,端放了 2 千萬的詞!本地詞庫是隔斷時間更新,而云端則是實時更新。本地就是二元模型,云端是三元模型,就類似于是翻譯機,所以可以讓準確率達到非常高。

其實在谷歌之戰中還有一個很重要的經驗,認真把專利申請下來。我們把“云輸入”叫做晦澀的“一種字詞轉換結果的獲取方法及系統”,這是我們最基 本的模型。除此之外,為了打出更多的詞,我們還用了什么方法呢?不是所有的詞,都是靠云端收集的,我們知道中國人取名是有規律的,比如說王建軍的“建”就 是建設的“建”,因此我們要去知道名字的秩序,我們去找了相應的數據,也通過內部的關系去人人網拿了關于人名的數據進行研究、拆解。移動端使用時,我們還會把通訊錄的人名讀取出來作為數據研究。

另外一個例子,很有意思,骰子這個字讀(tou),但是 shaizi 也可以打出來,這也申請了一個專利在后面。

王小川:搜狗的前生今世

在詞庫這方面也有一個壓力,互聯網時代出現了很多詞。比如,有一段時間火星文很火,因為個人覺得破壞傳統文化,當時沒有引進詞庫,后來就覺得自 己錯了,自己太老態了:年輕人用新東西,應該支持它,讓它發展。怎么讓自己放下年齡的劣勢,跟年輕人走,這是我現在所反思的問題。

我們去分析了鍵盤上的鍵盤使用情況,發現 Space,Backspace 使用頻率很高,于是我們做了一個糾錯系統,在“默默地糾正錯誤,好事不留名“和”嘚瑟一下,提示錯誤“中,最后我們還是選擇了后者。

還有一些別的專利優化,比如說“聯想輸入”這些專利。再講一個例子,我們發現小寫字母,安卓本身帶的輸入法,會帶來粘連,因為小寫字母本身不 平,在視覺上會干擾到用戶,因此我們進行了優化,把字往上提,并默認使用大寫字母,因為他們更規則,字更平,并將字的間距拉開,在優化之后,搜狗輸入法的 點擊準確率的 85% 提高到了 90%。

改變一種行為習慣是有風險在的,是會被罵的。記得 QQ 有一次升級,就是變成全部在線狀態,被罵得一塌糊涂。當初還有很多類似的暗諷段子,后來迫于輿論壓力,QQ 改版回去了。

王小川:搜狗的前生今世

如何讓輸入法更省力,并讓表達更有意思?

王小川:搜狗的前生今世

比如說:

走你(┏ (゜ω゜)=?),

王小川:搜狗的前生今世

孫楊( ̄へ ̄)字符畫,我們從“讓輸入法的打字更省力“變向”讓表達更簡單“。PC 里面不僅可以打文字,也還可以打好玩的表情,這一次我們發布了花邊字,專供 IOS 用戶用的,讓表達變得更加好玩、更簡單,幫你去做一些創作。

王小川:搜狗的前生今世

除此之外,我們也是最大的 UGC 皮膚基地:10 萬多個皮膚、3 萬多個作者。

王小川:搜狗的前生今世

在輸入法背后,我們做了這樣三件事:一個就是大數據,在這個“大數據“都快成了過時詞匯的今天,我們用了 100 億的網頁幫用戶編輯和表達;二是云計算,利用云端更強大的計算和存儲資源去提供服務;三是全球最大的 UGC 皮膚園地之一。在這背后,就單單輸入法,我們背后有 200 多項專利。IE 瀏覽、視頻提取、號碼庫這些也都是我們做的創新。我們要把自己更多的精力放在產品和創新。

六、搜狗輸入法的商業化啟示

作為一個免費的輸入法,怎么讓它變得有商業價值。我覺得重要的是兩個,第一個叫工具,第二個叫服務。

王小川:搜狗的前生今世

產品不能幫助用戶做選擇,而服務,就是用戶對結果正確性無精確的定義,產品需要幫助用戶做選擇。工具的商業價值小,服務的商業價值大。

王小川:搜狗的前生今世

討論下羊毛出在豬身上的問題,請注意,我們講的是一款產品上的豬和羊的問題,而不是一個產品的價值轉到另外一款產品上去。有時候服務的價值在哪?騰訊最 后是靠游戲是去賺錢;淘寶就是一個服務,搜索是排序的;微博本身是工具,它在信息流里插入了用戶期盼之外的東西,它把“工具”服務化,之前因為政治因素避 免審查,微博會刪掉一些消息,可是這樣容易得罪用戶,因而他后來就想了一個辦法,把信息延遲展現出來,這也是微博的能力和權力,調配信息流的順序,這也是 一種服務;非死book 插廣告,用戶接受了,就是一種服務。Hao123 是一種服務,編輯了一個選擇范圍給你。

番茄服務和 hao123,是兩個很重要的服務模式。我們之前好奇,搜狐的訪問來源是哪里來的,通過服務器查詢發現 hao123 占了其中大概三分之一。

再說,智能硬件該是工具還是服務呢?我認為不帶有幫助用戶做選擇的產品不算是智能產品,雖然有創新,但商業價值不高。工具,意味著智商等于0,你動一下它用一;智能意味著:0<智商<用戶;而智慧則表示:智商>=用戶。

所以,有三個概念:

王小川:搜狗的前生今世

1、從工具到服務;

2、從企業內部來講,就是從連接到智慧;

當連接無處不在時,需要機器幫你做選擇,這時候連接已經沒有價值,而是判斷連接產生價值。

3、智能硬件:從擬人到取代人。

現在冰箱聯網了,電視機聯網了,可是孩子還沒聯網,這是一個新的浪潮,擬人或者取代人。這時候我們看看,GOOGLE 在干什么?它在干無人駕駛,取代司機,開始會利用自己的視覺能力自己學習;Nest 在家里幫你調節溫度、光線,是自己去探知你想要干什么;掃地機器人,取代保潔阿姨。

七、搜狗輸入法的未來展望

王小川:搜狗的前生今世

那我們下一步想做什么東西?就是讓表達和獲取信息更簡單。比如說在蘋果手表里,一個框內輸入,即便是滑行輸入,都已經成為了一種很笨、不太被人所接受的做法,那我們設想搜狗通過短詞去猜測你想要說什么,這時候,工具就變成了服務,在人的輸入里面就會變得更加容易。

手機端對 PC 端的取代,并不僅僅是輕了,可以移動了,而是提供更好地認知世界的方式。如果我們把人的表達和對世界的感知追到極致,這讓我想到電影《她》里面所描述的超智能系統,這是我對未來世界的構想。

希望大家在自己的路上都能夠勇于突破,實現自己的理想。

來自: 創業邦

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!