微軟圖像識別系統準確率躍居第一 擊敗谷歌
北京時間 12 月 11 日消息,據科技博客 VentureBeat 報道,在第六屆 ImageNet 年度圖像識別測試中,微軟研究院的計算機圖像識別系統在幾個類別的測試中拔得頭籌,擊敗了谷歌、英特爾、高通、騰訊以及一些創業公司和學術實驗室的系統。 ImageNet 是全球最大的圖像識別數據庫。
微軟的獲勝系統名為“圖像識別的深度殘差學習”(Deep Residual Learning for Image Recognition),由微軟研究員何愷明、張祥雨、任少卿和孫劍組成的團隊開發。微軟稱,公司將在未來發表的論文中詳細介紹這一系統。
考慮到這項技術的復雜性,它可以稱得上一項了不起的成就。“我們對神經網絡的訓練深度超過了 150 層,”該團隊稱,“我們提出了一個‘深度殘差學習’框架,它能夠減少優化,整合極深度網絡。當網絡的深度在之前基礎上顯著加深時,我們的’深度殘差網絡’ 的準確率就會提升。這種準確率的提升是很多普通網絡在加深時無法達到的。”
科技公司現在十分熱衷于深度學習領域的研究,他們希望借此改進自主內部系統及其消費級產品。深度學習是高性能網絡的核心,涉及在照片等大數據基礎上訓練人工智能神經網絡,然后向它們提供新數據,獲得推斷結果。
微軟已經通過幾款有趣的應用展示了公司在人工智能領域的實力,比如“我看起來有多大”(How Old Do I Look?)、“我的胡子怎么樣”(How’s My Moustache Doing?)。微軟還建立了 Project Oxford 項目,以實現圖像識別技術的商業化。
ImageNet 要求參賽系統對來自圖片分享網站 Flickr 和搜索引擎的 10 萬張照片進行精確定位,然后盡可能準確地將他們劃分到 1000 種目標類別下,包括狼蛛、iPod、清真寺、玩具店、調制解調器等。
微軟獲勝系統的分類錯誤率為 3.5%,定位錯誤率為9%。過去幾年,谷歌、創業公司 larifai、NEC 一直在圖像分類準確率上占先。
微軟的系統今年還在 ImageNet 的目標偵測測試中占據第一位。“甚至連我們自己都不相信這種單一想法能夠取得這么好的效果,”孫劍稱。
百度并未參與今年的 ImageNet 測試。去年,百度的測試存在違規行為,采用了密集測試的方法以提高成績。百度隨后道歉,并解雇了團隊負責人。百度因此被禁止提交測試成績 1 年。
在這次測試中,IBM 提供了 SoftLayer 公有云服務供參賽團隊使用,使用的是英偉達的圖形處理器。