讓文獻上的算法走進真實世界,打造算法的“App Store”
算法正在改變世界。
每天打開的網頁和應用,無一不是強大的算法在背后運轉,決定你看到什么、喜歡什么、看什么樣的書、交什么樣的朋友,甚至過怎樣的生活……
但是,對于開發者們來說,這還不夠。日益膨脹的數據要求他們用更新、更強大的算法來挖掘出這些海量數據背后的秘密,但是新算法的尋找成本、試用 成本,卻都讓很多公司望而卻步;與此同時,學院派和大公司研究院里最新的理論成果,頂多在獲得了研討會上的幾陣掌聲后,就躺在了文獻的故紙堆里。
在企業家和學術界之間,仿佛隔著一道無形的鴻溝,難以跨越。
這點,被稱為面向算法的“App Store”的 Algorithmia 兩位創始人,可能知道地最清楚。
CEO Diego Oppenheimer 是微軟 Excel 團隊的成員,主攻商業智能和數據分析工具。如果你曾經用 Excel 來處理非常大型的數據,那可能背后就有他的努力在。他的工作之一是每天都想著要找到最好用的算法,來提高數據的處理效率。有一天,他打電話給微軟研究院, 尋求一種算法,對方建議他可以去聯系研究院的 XX 教授。于是繞了幾個彎之后,他聯系上那位博士,對方和他說,“啊,我已經在這個算法上研究了六七年了!”
而與 Oppenheimer 相反,Algorithmia 的聯合創始人 Kenny Daniel,則是一個相當學術的人。他在南加州大學獲得了博士學位,并且為美國交通部定制了一個算法理論,來讓交通資源可以最大規模優化。可以用 Oppenheimer 的話說,Daniel“是一個寫代碼的天才。” 但是后來發生的事讓 Daniel 很沮喪:他的學術成果發表了,大家都跑來向他發來祝賀,然后呢?他苦心研究的成功就躺在了文獻里,再沒有然后。
就是這些經歷,讓 Oppenheimer 和 Daniel 決定一起做些什么,改變這一現狀。Oppenheimer 告訴 PingWest,在那個教授告訴他自己已經研究那個算法很長時間的那一刻,“我完全震驚了!心里想說,你為什么從來都沒有告訴我們?我們還是在同一家公 司!”Oppenheimer 說,“微軟有很多這樣頂尖的研究員——但是如果在一個公司內都是這個情況,可以想想整個世界是怎么樣的?而且,再設想一下,如果我不是微軟的員工,而是一 個中型公司的成員,我又怎么樣能找到這樣的算法呢?”
于是就有了 Algorithmia 的誕生。它的模式很簡單,就像是應用商店,只不過,里面出售的不是一個個應用,而是一個個算法。它的用戶,也不是普通的消費者,而是開發者或者互聯網公 司。“大家可以把自己的算法放到我們的平臺上出售,需要的人就可以購買使用。就是這么簡單。”Oppenheimer 說。
但是其實一點也不簡單。很多作者未必想要把自己的成果開源,而且如果僅僅是提供算法,那么開發者購買試用的成本也并沒有降低。為了真正能夠實現 “算法的交易”,他們需要做很多額外的事情:比如搭建自己的云平臺,這樣一旦用戶找到需要的算法,不需要下載安裝,而只需添加幾行代碼,導入自己的數據, 就可以獲得返回結果,從而避免了要把算法集成進應用;它也能夠根據算法的規模,來調整自己的運算能力。
“我們不僅提供交易的平臺,還提供很多服務,這樣的話,用戶們不用去下載文檔,而是可以直接通過我們的服務器進行部署。只有這樣,作者們會放心 把算法放到平臺上,用戶們也會樂于購買。因為嘗試新算法的成本會非常低。”Oppenheimer 告訴我。“你看,現在的問題就是,算法的實驗成本太高。你必須要有個人去讀那些文獻,然后下載代碼,然后安裝部署,還要不斷調整。但是很可能一周過去后, 發現這個算法并不能解決問題。這樣就浪費了大量的精力和時間。但是在 Algorithmia 的平臺上,用戶們只要花幾個小時最多一天的時間去比較各種算法,然后進行測試。這樣一來,選擇新算法的風險就降低了很多。這樣才能促成新算法的大規模應 用。”
但是怎么來保證算法的質量呢?最主要的還是搭建起自己的社區。比如,對于開源的算法來說,人們可以看到代碼,所以可以相互改善;而即使不是開源 的算法,在它運行的時候,Algorithmia 也會有一些 metric 來追蹤,來看是不是有什么異常的行為。另外,開發者們也會有自己的聲望,可以查看他們的背景信息和資料,而隨著平臺的進一步擴大,用戶們對算法及其作者評 價將會是重要的依據。同時,一旦算法得到更多人使用,那么算法開發者們也可以獲得更高的收入。
有趣的是,Algorithmia 團隊也會采用在自家平臺上出售的那些機器學習的算法,來對平臺上各式算法進行分類和排序。包括標簽、相關性、作者說明等信息,而在算法的作用下,也會呈現 出類似 Amazon 網站上購物體驗的效果,比如針對你的歷史記錄進行個性化推薦,或者顯示出,“喜歡這個算法的用戶還瀏覽了其他哪幾個算法”,等等。
就像我之前寫過專注預測功能的機器學習服務器 Prediction IO 一樣,還有很多垂直的平臺也在做算法出售的事情,但是 Oppenheimer 認為,這只能證明這個領域的需求非常強勁,人們都在尋找好的解決方案。“但是我們不選擇做垂直領域的原因,就是因為算法本身就是跨領域的,而且不同算法之 間可以相互協作。”
盡管愿景很宏大,但是 Algorithmia 是一個 4 個人的初創公司,這也意味著在一開始,在算法作者和應用者之間,他們必須得有一個當前的重心。“我們是一個面向算法開發者的平臺,想要讓那些美妙的算法得 到應用,但是,只有在市場需求很強的時候,這一情景才會實現。所以,我們目前主要的重心在于獲得好的算法,建立起這個社區。”Oppenheimer 說。
看起來,Algorithmia 已經取得了不錯的開端。他們選擇從學術界先下手。雖然算法開發者并不局限于學術界,但是學術界無疑是最明顯的例子。學者們進行了多年的研究,發表了論文, 代碼也都成型,但是,如果不商業化,也許就只能眼睜睜看著它在三年后因為沒有人維護和更新變得落伍——既然這樣,為什么不把它放到 Argrithmia 上呢?教授們可以看著自己的算法被使用、運行,更新、改變世界,而他可以繼續回到他的研究工作中去,更別提還會帶來不錯的收入了。
Oppenheimer 和 Daniel 收獲了很棒的回應。一個月前,他們去了卡耐基梅隆大學——一所在計算機科技領域拔尖的學府,教授們的反饋很讓他們興奮。然后他們去了哈佛、MIT、斯坦福……
“那些學校里的人都給了很正面的反饋。”Oppenheimer 說。他們甚至還在華盛頓大學里收獲了一個投資人,對方對于 Algorithmia 的出現非常興奮。“當然有的人也會有一些問題,比如,大部分教授問的第一個問題是,那知識產權是誰的?這個毫無疑問,當然屬于他們。當我們這么說了之后, 他們的反應都是,那太棒了!”
當然,對于 Algorithmia 來說,這并不僅僅是美國市場的事,Oppenheimer 想要把它做成一個全球性的平臺。這當然合理,還有那種語言比代碼更能全世界通行呢?
亞洲顯然就是他寄望頗深的一個地方。在整個采訪中,他多次興奮地和我說,“我們非常期待。亞洲將是非常非常重要的部分。” 不過,他指的不是那里的人口,而是產出的高水準的工程師和學術人員——“如果能把他們吸引進來,那將會是 Algorithmia 平臺上最大的內容貢獻者!”所以他們選擇引入日本電商網站樂天旗下的風險基金 Rakuten Ventures 作為 Algorithmia 的早期投資者之一,也是希望有一天,能夠借助樂天在亞洲的影響力和資源,迅速擴張。
但 Oppenheimer 同樣強調了中國。他告訴 PingWest,中國有太多優秀的工程師,也有很多人在計算機科學領域進行了非常深入的研究,但是沒有太多可以發布到全球的平臺,而 Algorithmia 無疑會是一個很好的機會。Oppenheimer 甚至借鑒了之前 GitHub 的遭遇,“我們想要每個人都可以接觸到 Algorithmia,即使是在墻內。所以我們也在考慮說把算法部署在中國公司的私有云內,把公司內部的算法和我們的相結合。”
目前 Algorithmia 已經完成了一輪 240 萬美元的種子輪融資,由 Madrona Venture Group 領投,其他機構投資者包括 Rakuten Ventures、Deep Fork Capital 等。不過,現在產品還是在 Beta 測試的階段,但是 Oppenheimer 告訴我們,最遲到今年年底,他們會對外公測。
到時候,你就可以看到,算法的 App Store,會不會像應用商店一樣改變世界了。
<span id="shareA4" class="fl">
</span>