微軟和 IBM 先掌握機器學習技術,但 Google 更快
機器學習是 2015 年科技圈一個非常熱門的詞匯,似乎只要在產品宣傳上用這個詞就高大上了許多。
“機器學習不是魔術,而是一個工具。”在 Google 亞太媒體會議的演講中,Google Brain 項目聯合創立者 Greg Corrado 要給機器學習去魅。
油Tube 原視頻點這里((Google 官方解釋機器學習視頻,對英語聽力有一定要求)
20 世紀 80、90 年代,機器學習的思想流派之一模式識別曾非常流行,它強調的是如何讓一個計算機程序去做一些看起來很“智能”的事情,例如識別“3”這個數字。
(模式識別中,一個字符“3”的圖像被劃分為 16 個子塊)
模式識別需要專家為每一個問題編寫出一個專門的程序來解決,效率并不高。90 年代初,人們開始意識到一種可以更有效地構建模式識別算法的方法,那就是用數據去替換專家。Greg 說道:
編寫程序讓計算機變得更加聰明,要比編寫程序讓計算機自己學會變聰明難得多。
</blockquote>機器學習這個概念認為,對于待解問題,無需編寫任何專門的程序代碼,只需要輸入數據,算法會在數據之上建立起它自己的邏輯。
機器學習分監督式學習和非監督式學習,Greg 主要介紹了監督式學習:“首先我們有一個模型(帶有參數的公式),輸入標記好的數據樣本,運算公式出來一個結果,然后檢驗運算結果和正確結果的偏離。為了 減小偏離,機器會對其公式的可調參數進行調整(這些可調參數常被稱為權重 weight,是實數)。”機器學習的目標是不斷嘗試不同的權重值,使偏離盡可能的小。
![]()
在機器學習發展過程中,出現了一個分支叫深度學習,由我們大腦中的神經網絡啟發而來。
深度學習強調的是使用的模型,最流行的是被用在大規模圖像識別任務中的卷積神經網絡(Convolutional Neural Nets,CNN),簡稱 ConvNets。
將深度學習帶入 Google 的第一人是 Geoffrey Hinton,他是全世界研究神經網絡系統最早的專家之一。Geoffrey Hinton 曾表示:
微軟研究院和 IBM 先掌握了深度學習技術,但 Google 在將技術轉變成產品方面比任何企業都迅速。
</blockquote>比如,Gmail 的反垃圾郵件機制、前段時間剛上線的郵件自動回復用的是前向神經網絡(Feed-Forward Neural Network),語音識別和 Google 翻譯使用的是深層遞歸神經網絡(Deep Recurrent Neural Network),Google Photos 使用的則是上面提到的卷積神經網絡。
![]()
今天,Google 在前沿技術應用上又往前邁了一步,將內部一直使用的第二代機器學習系統 TensorFlow 開源。
Google 曾在 2011 年推出了第一代機器學習系統 DistBelief,在此基礎上發展出來的 TensorFlow 沒有被束縛在 Google 自身的 IT 架構內,能夠被任何有相關背景的人進行配置。
“一些很小的創業團隊沒有這么多精力投入到機器學習研究中,現在他們可以直接使用我們的 TensorFlow 代碼庫,從而專心于自己的主業務。”Greg 在接受愛范兒采訪時說道。
Google 也并非完全毫無保留,目前開源的是其引擎中較為頂層的算法。硬件基礎設施系統并沒有開源。Google 也不是第一個將機器學習系統開源的科技巨頭。
非死book 早在今年一月份就公布了一個機器學習的開源項目,他們將一些基于機器神經網絡的產品免費放在了關注深度學習的開源軟件項目 Torch 上。此外,機器學習方面的開源軟件框架還有 Theano 和 Caffe。
via 愛范兒本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!