誰能幫你猜 12306 驗證碼,就指望深度學習啦
近段時間以來,大家紛紛被 12306 的神級圖像驗證碼給擊敗了,網上吐槽一片。正好最近在深度學習方面的一項圖像識別測試比賽中,各大科技公司又取得重大突破,微軟還拿到了第一名。也許,將來我們可以指望微軟小冰來幫你識別那些神級圖像驗證碼了。
據科技博客VentureBeat報道,在第六屆ImageNet年度圖像識別測試中,微軟研究院的計算機圖像識別系統在幾個類別的測試中拔得頭籌,擊敗了谷歌、英特爾、高通、騰訊以及一些創業公司和學術實驗室的系統。ImageNet是全球最大的圖像識別數據庫。
ImageNet數據庫中的iPod圖片
微軟的獲勝系統名為“圖像識別的深度殘差學習”,由微軟研究員何愷明、張祥雨、任少卿和孫劍組成的團隊開發。微軟稱,公司將在未來發表的論文中詳細介紹這一系統。
考慮到這項技術的復雜性,它可以稱得上一項了不起的成就。“我們對神經網絡的訓練深度超過了150層,”該團隊稱,“我們提出了一個‘深度殘差學 習’框架,它能夠減少優化,整合極深度網絡。當網絡的深度在之前基礎上顯著加深時,我們的’深度殘差網絡’的準確率就會提升。這種準確率的提升是很多普通 網絡在加深時無法達到的。”
科技公司現在十分熱衷于深度學習領域的研究,他們希望借此改進自主內部系統及其消費級產品。深度學習是高性能網絡的核心,涉及在照片等大數據基礎上訓練人工智能神經網絡,然后向它們提供新數據,獲得推斷結果。
微軟已經通過幾款有趣的應用展示了公司在人工智能領域的實力,比如“我看起來有多大”、“我的胡子怎么樣”。微軟還建立了Project Oxford項目,以實現圖像識別技術的商業化。
ImageNet要求參賽系統對來自圖片分享網站Flickr和搜索引擎的10萬張照片進行精確定位,然后盡可能準確地將他們劃分到1000種目標類別下,包括狼蛛、iPod、清真寺、玩具店、調制解調器等。
微軟獲勝系統的分類錯誤率為3.5%,定位錯誤率為9%。過去幾年,谷歌、創業公司larifai、NEC一直在圖像分類準確率上占先。
微軟的系統今年還在ImageNet的目標偵測測試中占據第一位。“甚至連我們自己都不相信這種單一想法能夠取得這么好的效果,”孫劍稱。
百度并未參與今年的ImageNet測試。去年,百度的測試存在違規行為,采用了密集測試的方法以提高成績。百度隨后道歉,并解雇了團隊負責人。百度因此被禁止提交測試成績1年。
在這次測試中,IBM提供了SoftLayer公有云服務供參賽團隊使用,使用的是英偉達的圖形處理器。
參考原文:http://tech.ifeng.com/a/20151211/41521778_0.shtml 作者: 簫雨