谷歌開源人工智能系統TensorFlow的來龍去脈

jopen 9年前發布 | 27K 次閱讀 TensorFlow
 

谷歌開源人工智能系統TensorFlow的來龍去脈

據國外媒體報道,谷歌于周一發布全新人工智能系統TensorFlow。該系統可被用于語音識別或照片識別等多項機器深度學習領域,主要針對2011年開 發的深度學習基礎架構DistBelief進行了各方面的改進,它可在小到一部智能手機、大到數千臺數據中心服務器的各種設備上運行。

更重要的是,谷歌表示,TensorFlow將完全開源,任何人都可以用。所以,這其中有幾個意思?

關于TensorFlow的前世今生

TensorFlow是谷歌研發的第二代人工智能學習系統,而第一代的DistBelief比這個要早好多年。

DistBelief誕生于2011年,它是谷歌推出的第一代內部深度學習結構,能夠幫助谷歌利用自家的數據中心構建大型的神經網絡,主要應用于人工智能的開發,比如語音識別、圖片搜索等等。

但是,DistBelief本身存在一些技術上的短板,對谷歌的人工智能發展仍有一些限制。如谷歌高級研究員Jeff Dean和技術主管 Rajat Monga表示,DistBelief關注的重心是神經網絡,而且與谷歌內部的基礎架構聯系緊密。也就是說,該系統“幾乎不可能與外部共享研 究代碼”,而且使用起來比較難設置。

而TensorFlow正是基于第一代DistBelief進行開發的,其命名來源于本身的運行原理,Tensor(張量)意味著N維數 組,Flow(流)意味著基于數據流圖的計算,TensorFlow即為張量從圖象的一端流動到另一端——將復雜的數據結構傳輸至人工智能神經網中進行分 析和處理。

相比較之下,作為谷歌第二代人工智能系統,TensorFlow更快、更智能化,也更加靈活,可以更加輕松地應用于谷歌的新產品以及支持技術研究。按某些標準計算,TensorFlow的運行速度相當于DistBelief的3倍。

此外,TensorFlow一大亮點是支持異構設備分布式計算,它能夠在各個平臺上自動運行模型,從電話、單個CPU / GPU到成百上千 GPU卡組成的分布式系統。也就是說,任何基于梯度的機器學習算法都能夠受益于TensorFlow的自動分化(auto- differentiation)。

谷歌為什么敢開源?

鑒于TensorFlow系統的強大功能,加上谷歌正計劃在TensorFlow的基礎上發布ImageNet計算機視覺模型,理論上使用谷歌的 樣本模型架構的話,就能很快地開始使用機器學習技術,因此,它可謂谷歌在計算機智能應用方面的殺手锏。不過,谷歌公司表示,開源該系統并不會危及公司的戰 略,而且還是會讓公司保持優勢。為什么呢?

通過谷歌最新公布的白皮書 TensorFlow: Large-Scale Machine Learning on Heterogeneous Systems 可見,雖然該系統轉為開源,但這次開源的TensorFlow是單機實現,其最有價值的分布式數據流實現,并沒有開源。也就是說,谷歌此舉還是留下了一些 能保持自身獨特性的東西,比如巨量的數據、可以運行該軟件的計算機網絡,以及一個龐大的可以調整算法的人工智能專家團隊。

谷歌開源的做法,其實和非死book開源人工智能研究的舉措相類似。深度學習系統或軟件不是一裝上就能用的,它在發布前期需要通過使用者數據進行很多 測試、調整,顧名思義就是一個學習的過程。非死book開放人工智能研究就是因為缺乏自己的移動操作系統和通信渠道,沒有什么途徑來檢測產品,唯有通 過與其他公司組織合作,來完善創新。

同樣,如果谷歌沒有工程師來為其進行數百萬個參數的調整,那么谷歌這次放出的深度學習算法的用途就極為有限。專家表示,調整這些參數需要不斷試錯,初次接觸的人要花費很長時間。谷歌也需要通過放出這套系統吸引更多研究人員,從而為其找到新的用武之地,并進行改進。

據報道,谷歌2011年展開了一個試圖訓練神經網絡的Google Brain項目。Google Brain在當時擁有1.6萬個多個微處理器,創建了 一個有數十億連接的神經網絡,在這個項目研究中,該網絡結果觀看了千萬數量級的油Tube圖像,并從圖像中自主辨識出了“貓”。研究人員表示:“在訓 練中,我們從未告訴它‘這是一只貓’。基本上可以說,它發明了貓這個概念。”

TensorFlow的未來

2004年,Google創始人Larry Page和Sergey Brin曾預言道:“計算機將會被植入人類大腦,搜索會成為一種自主進行的 行為。”11年之后的今天,Google沒有將搜索功能植入大腦,但該公司將搜索機器變成一個人工智能大腦。“這是一種能夠讓研究人員的創意直接轉化成產 品的工具,以后研究人員或者就無須再為什么新想法重新編寫代碼了。”

這是谷歌未來的愿景,而TensorFlow就是通向這個未來的里程碑之一。開源TensorFlow能夠加速谷歌在人工智能技術的部署,幫助該公司在人工智能發展日益重要的未來搶占更多的主導權。

不過當然,開源就存在著多方合作的可能,數據的資源共享、技術研究的交流碰撞……谷歌的發展同樣也會帶動業界的技術整體發展。多年以前人們就知道開源的重要性,正如開源硬件公司ArduinoCEO Musto所言:“我們需要開源,我們需要社群的智慧。”

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!