余凱豪言:進入深度學習時代,百度可以比Google、非死book做得更好
原文 http://www.36kr.com/p/218924.html
剛剛結束的極客公園上,百度深度學習研究員常務副院長余凱分享了深度學習技術為百度的技術和產品帶來的變化。今天的未來論壇中,余凱又向 36氪 介紹了近期百度在AI和智能硬件領域的研究進展。
深度學習:百度可以比Google、非死book做得更好
過去兩年里,百度在深度學習領域做了很多事情。百度大腦已經取得了相當的進展,它無時無刻不在學習、演進和進化,具有相當強的工程能力。在兩個月 前我給大家介紹的時候說我們用百億級參數構建了世界上最大的深度學習網絡。今天,這個數據已經是千億級。在此基礎上我們可以做很多很多事情。
百度在搜索、廣告投放、圖象識別、語音識別,這些領域,都有相當的進展。
在廣告投放這個領域,整個百度的鳳巢廣告系統已經進入深度學習的時代,廣告點擊率提升非常顯著,具體的數字是商業秘密我不能講,但是百分比兩位數的提升,所以這對公司的營收產生了巨大貢獻。
在過去幾年里面,技術的發展經歷了一個從量變到質變的過程。以圖像分類為例,2010年的時候世界最好的成績也并不理想,隨著深度學習的發展,每年都在以很快的速度演進。
2014年底百度做到了5.9%的錯誤率,這是世界上最高的圖象識別準確率。去年我們在物體檢測上面的單個模型實驗結果顯示,百度是最好的,Google是第二。
在語音這塊,百度語音搜索在兩年時間識別率提升了很多。現在移動搜索產品中10%的搜索需求來自語音搜索,增速也很快。
我們還推出了“百度翻譯”。你可以在紐約街頭說句中文,馬上語音識別翻譯成中文文字,最后自動翻譯成英文。還可以自動拍照——比如外國人來上海看到中文菜單,拍照識別成英文。
在人臉識別技術方面,去年非死book人工智能實驗室宣布他們做到世界上最好的成果,準確率是97.35%。前幾天,我在百度的同事取得了一個更激動人心的進展,人臉識別準確率達到99.62%。
斯坦福大學的科研人員最近用人做了一個測試,人在這個數據上達到的是99.2%。當然,必須澄清, 在一個數據極上,機器的算法做到了人的水平,但整體來講機器比人還是有非常大差距的 。
Baidu Car:我們想用更好的算法和能負擔的零件來完成這件事情
與Google的無人駕駛不同 ,我們認可的是人車一體化的自動駕駛。這個過程會分為幾個階段。 第一階段是輔助安全;第二階段是主動安全;第三階段是特定場景下的自動駕駛 ,比如大型物流中心中的重復駕駛,高速公路上的自適應巡航;然后是高度的自動化。
我們的成本也不會像Google那么高,它們的感應器很貴。我們想用更好的算法和能負擔的零件來完成這件事情。我們在車里做了仿真系統,利用深度學習開發圖象識別技術,用低成本完成這個任務。
具體的落地上來看, 我們先要具備建立高精度地圖的能力 ,這其實是一個基礎建設。我們要做到10-20厘米量級的精度,這樣的數據就會很有價值。如果能做到這樣,就能提供更精準的導航。可以預見,在后面的 1-2年時間里,整個導航系統會發生翻天覆地的變化。比如說在上立交橋的時候,有的時候前面面臨3-5個分杈口,看二維地圖很難找準方向。而我們對車的定 位要到車道級別,這樣就能更精準地導航。
Baidu Eye:今年會有令人興奮的進展
Baidu Eye的迭代很快,與 上次向 36氪 介紹的情況 相比,已經有很大的進展。它更像是跟著你的機器人,不光定位,還能知道佩戴者在關注什么,在此基礎上拓展你的信息空間。比如在博物館的場景下,當你看到一 幅油畫,它就能告訴你有關這個油畫的作者、風格、歷史背景等信息。電腦到手機是一次跨越,從手機到眼鏡會是又一次非常重要的跨越。百度正在做一些超前的思 考和嘗試,今年Baidu Eye會有令人興奮的進展。當然,還是會在垂直領域。
[ 36氪 原創文章,作者: 廚子與劍客]