微信早期員工李明強創辦“圖普科技”,只要會用Excel,就能訓練深度學習的圖像識別模型
隨著讀圖時代的到來,大量的內容產生在圖片和視頻上,對圖片的識別、理解和分析需求越來越強烈。一時間,圖像識別、深度學習、人工智能成了一線大 公司要拿下的戰略要地,百度有深度學習研究院,阿里也把《大數據》和《數據之巔》的作者徐子沛挖來任副總裁布局數據挖掘。對一般公司來說,它們往往沒有人 工智能方面的工程和技術能力,但又有處理大量圖片數據的需求,這個矛盾該怎么破?
作為微信創始團隊成員之一的李明強創辦的“ 圖普科技 ”,其2B業務“圖像識別開放平臺”便是要幫助 企業定制自己的圖像識別引擎 ,企業無需聘請人工智能識別的專家組建研發團隊,在web界面上即可操作。李明強告訴 36氪 ,“這個圖片識別云平臺的好處是降低了人工智能的使用門檻,只會用excel的非技術人員經過簡單培訓就能上手。”
圖普開放平臺基于圖普科技積累的深度學習技術和工程經驗,包含標注系統、多GPU并行調度系統、統計和效果分析平臺、測試平臺和API等。其具體操作流程是:企業用戶在申請賬號并建立了一個新的識別項目后,再 上傳數據(web或sftp)——標注數據(自己打標簽)——訓練模型——通過云服務調用模型 就可以了。為了保證效果,上傳數據和標注數據可以多循環幾次,不斷優化。關于上傳圖片數據和打標簽舉例如下:
色情/非色情
廣告、垃圾/正常
風景/人物/食物/汽車/數碼/...
有水印/無水印
美女/丑女
歐美范/日韓范/文藝范/潮女范
甚至還有股票的波形:頭肩底/圓弧底/W底/...
等等
李明強將這個“圖像識別開放平臺”比作一個聰明的孩子,企業用戶只要上傳各種應用場景下的圖片數據來“教他”(數據訓練),這個孩子看得越多就學得越好,干活也就越靠得住。圖普則負責硬件和軟件的問題,算法和工程的問題。
目前圖普科技的合作伙伴有迅雷、花瓣網和又拍云。拿迅雷的黃色圖片監控來說,如果用傳統方法,迅雷通常會用到幾十個鑒黃師,每位鑒黃師一天能審核 兩萬張圖片,而圖普科技能為迅雷節省90%的審核人力,一臺鑒黃機器每天可以審核五千萬張圖片,其單個視頻處理時間小于1秒,100張圖片處理時間小于1 秒。加總起來,圖普機器人目前每天的處理量是1.2億張圖片、30萬個視頻,且相對于人工審核98%的準確度,在這種處理速度下圖普的準確度是 99.5%。
圖普科技提供的這種云端服務模式是按照調用次數付費,調用量越大單價月底。如果企業的日調用量是1萬起,每張收費標準是1分;日調用量到了千萬級別,100張的收費是1分錢。
創始人李明強是原騰訊項目經理和T4技術專家。具有7年的互聯網產品項目管理、團隊管理、產品設計以及運營推廣的經驗;騰訊廣研敏捷研發流程的實踐者,并有3年電信行業經驗,05年加入騰訊廣州研發中心,同時也是微信立項時的創始成員。
[ 36氪 原創文章,作者: Nicholas]