【譯文】人工智能的今天

jopen 8年前發布 | 28K 次閱讀 人工智能 數據挖掘

本文為數盟原創譯文,歡迎轉載,注明出處“數盟社區”即可

作者: Alexander Heimonen

人工智能早在計算機學伊始時就已經產生,它最早是在1956年被作為一門學術學科建立起來。從那時起,科學界就認為每個十年左右就會在此方面有大的突破性進展。在1940年的神經學研究中,人們就已經發現人類的大腦實際上就是一條神經網絡, Alan Turing 表示基于此概念,建造一個電子大腦是可行的。1951年,一個24歲的研究生, Marvin Minsky 建造了世界第一個神經網絡機,這臺機器也被稱為 SNARC 它同時也是史上第一臺人工自我學習機器。

但是,如果在那時我們就已經有了關于人工智能正確的概念,那為什么人工智能在近年來才突然崛起呢?其實是因為類似的程序需要極其龐大的計算能力,早年的邏輯運算只要依靠遍歷樹算法,這也使得當時的計算復雜性較現今的技術成爆炸式的增長。數學中,我們稱它為組合爆炸,意思是作為組合性考慮的結果,所構成大系統種類可能的數目,比原有子系統的數量驚人地擴大。所以在當時,啟發式算法被作為重點傾注了大量的精力,用來尋找更快速地解決問題的方法,為求速度,只有犧牲全面性和準確性。啟發性算法幫助我們將備選項的的數量有指數級降低到多項式級。總的來說,啟發式算法十分有效,但也并不保證適用于所有地方。

人工智能的威脅

近年來,大量的媒體聚焦在人工智能的優勢上面,特別是在非武裝無人機以及武器技術上。這確實是理所當然的,美國軍方投入空前龐大的的資金在自感知機器人上面。一些學術界大咖領袖,包括物理學家 Stephen Hawking ,企業家 Elon Musk 以及億萬富翁,大慈善家 Bill Gates 近期共同發表了一封公開信來闡述如果我們不對人工智能技術的開發極端謹慎,它將會給我們人類所帶來的危害。他們都認為,人工智能的創造是人類歷史上濃墨重彩的一筆,但是如果我們不學會如何規避其帶來的風險,恐怕它也可能將是人類史上最后一個大事件了。

那么,對于人工智能,我們應該有多害怕呢?我認為他們的顧慮確是合理的,但是我們日常所接觸的大部分的人工智能屬于弱人工智能。舉例說明,平日里我們用來在兩個地點間選取最有效路線的實時GPS地圖應用就是一個弱人工智能。這種應用確實能以較人類千倍以上的速度完成路線規劃,但是你會說它是在思考嗎?不會,而這也正是與上述顧慮相悖的地方。

他們其實顧慮的是人們所說的強人工智能。那是一種能夠自主思考的人工智能,也許還有意識和做決定的能力。有些科學家認為到了2025年,我們的人工智能將會和一個人類一樣聰明,而到了2040年,單個人工智能的智慧也許將會是整個人類智慧的總和。這一個關于人工智能的問題也許可以分成兩個,第一個是如何創造這種智慧,第二個是如何給人工智能一個安全的制約,或如何給它們一個等同于人類的價值。如果我們能夠先將第二個問題解決,我們就沒有任何問題需要擔心。但是現在發生的一切也只是臆測,但是我也確實認為未知的才是可怕的。

“巨大的改變即將要來臨。工作、企業,甚至整個行業將會被重新改寫。”

 Paul Roetzer, CEO @PR 20/20

人工智能的今天

硅谷巨頭Google和非死book如今也正乘著人工智能發展的巨大浪潮。Google以4億美金的價格收購人工智能公司DeepMind,現今也正對這項技術進行試驗。非死book使用人工智能對圖片中人臉進行識別。然后我們也知道Google的全自動駕駛汽車能夠安全無事故行駛100萬英里。你的安卓手機能夠知道你上班的路徑,并且提醒你沿路是否通暢或者你所乘的巴士是否晚點。如果我在網上搜索周末去倫敦的旅游行程,那么非死book和網上的其他頁面就會被旅行廣告所充斥。人工智能現在真正的是無處不在,我敢打賭未來的全球500強企業一定會沿用這個方程:拿掉X,加入AI。

但這僅僅是開始。所有的云服務業巨頭,外加十多個初創企業,爭先恐后的想啟動一個像Watson(IBM的最新計算機系統)認知服務,語音識別軟件,基本上所有與人工智能有關的東西。根據數量分析公司Quid的分析,人工智能從2009年起已經吸引了超過170億美金的投資。單單2014年,就有20億美金分別投資在322家公司的人工智能相關的技術上。

非死book和Google早已開始招募研究員來壯大它們的人工智能研究團隊。Yahoo, Intel, Dropbox, LinkedIn, Pinterest, 以及推ter也從去年開始收購人工智能公司。過去的這四年中,在人工智能方面的私人投資平均每年增長了62%,這種迅猛增長的勢頭應該還會持續下去。

所以這一切對于我們來說意味著什么呢?難道我們就只能坐等硅谷大公司開發這項技術然后席卷整個市場份額嗎?好吧,老實說答案是對也不對,這一切主要取決于你想做什么。創造一個人工智能需要巨大的資源和數據,自然,數據越多,人工智能就會越聰明,所以某些大的企業就有了競爭優勢。比如所有人都會使用Google的搜索服務,所以它擁有最大量、最優質的數據來支持它的研究。因此我認為最終僅會有兩、三家公司會制造出完善的人工智能。就像因特網就是冷戰的產物一樣,我們也可以從對人工智能的研究中獲得很多其他的新技術。我們可以使用人工智能服務,利用人工智能的組件來探索、建立自己的構架,例如,機器學習或者深度神經網絡。

深度神經網絡

 “ 神經網絡和深度學習至今能夠給圖像識別 語音識別和自然語言處理中產生的問題提供最好的解決途徑 。-  Michael Nielsen

人工神經網絡的訓練方式是通過向它展示大量的訓練范例,然后逐漸對網絡參數進行調整,直至它能夠反饋出令人滿意的分類。一個典型的網絡是由10-30層人工神經元堆積架構而成的。舉例說明,當將一個圖片信息發送給一個神經網絡時,輸入層接收信息并且進行低層次的處理后將結果輸出給下一個層級,周而復始,直到到達最后一個層級,來決定該圖像的分析結果。

 “ 神經網絡的一個挑戰是要理解在每一層到底都發生了什么事。我們知道在(經過)訓練之后,每一層會逐步提取越來越高級的圖像特征,直到由最后一層做出顯示為何的決定(本質上)。例如,第一層也許在尋找邊緣或拐角。中間層分析基本的特征來尋找整體形狀(即大體輪廓)或其組成部分,比如一扇門或一片葉子。最后幾層將那些(要素)組合成完整的解釋——(如此,)這些神經元對非常復雜的東西諸如整個建筑物或樹木就有了反應。

 Alexander Mordvintsev

機器學習

深度神經網絡是深度學習的一個分支,也就成為機器學習中的一個分支。同樣機器學習也屬于人工智能的一個分支。此時此刻,機器學習是最實用、最有效的一個人工智能的分支。從定義上來說,機器學習探索和學習算法的結構,從而達到通過數據來學習和預測的目的。機器學習算法舍去了跟隨編程中傳統的嚴格邏輯,取而代之的是根據事例輸入的模型來依照數據來做預測和決定。依照學習輸入的本質,這些學習任務通暢被劃分成三個大類, 它們分別是:

監督式學習: 這種學習算法是利用訓練集合,指定理想的輸入和所期望的輸出來得到一個模型, 然后利用這個模型,將測試集合中的所有的輸入映射為相應的輸出,用來教授從輸入映射到輸出的一般規則。

非監督學習 :這種學習算法并不指定理想的輸入和所期望的輸出,直接對數據進行分析,令算法給出自己的解讀結果。然而,你可以給它提供分組數據,以幫助它達到更有意義的結論。

強化學習 從人類學習的方式得到啟發,該學習算法的僅僅指定了目標和一個動態交互環境,沒有任何關于它是否已接近其目標的輸入,該算法也會學習它各行為的后果。

其實大家也不需要把機器學習想的那么復雜。一個非常簡單但是卻很實用的例子來解釋機器學習就是利用線性回歸的概念。簡單來說,你在所有的結果集合中取大量的數據點,然后嘗試找到一條最符合該數據集的線性近似線。這篇文章的目的其實也并不是教授大家某一個具體的操作方式。我覺得,只要我們有足夠的創造力,我們可以在幾乎所有的我們正在開發的應用中找到人工智能的身影。舉例來說,在反詐騙偵查和信用風險的評估中查找異常行為,或者電商應用中的動態定價和產品推薦,或者Spotify中根據用戶所聽過的歌曲來推薦新的歌曲。他們所做的實際上就是運用深度神經網絡來分析每首音樂,然后根據結果來向用戶進行推薦。所以,它其實需要的不僅僅是海量的云數據!

“它將會更注重音樂本身。你將能夠通過音樂內容本身來搜索,而非通過音樂所附的文字信息。”- – Nicola Montecchio,  深度學習 總監 @Spotify

總結

我個人認為, 這些概念很多都十分容易理解,如果想要像開發人員一樣保持身在其中,我們就需要在這些相關技能開始進行投資。我們正在逐步走向一個真正的大數據世界,想要保持競爭力,高效的分析技術在這個時代是必不可少的。請想象一下,使用這一技術,我們在應用程序中是可以創建怎樣的的用戶體驗!

現在我想告訴大家一些我所做過的事情。我曾經在瑞典最大的數據電信公司工作過,他們的賬單和客戶信息儲存在一個經濟系統中,而他們將客戶使用寬帶網絡的相關費用記錄在另一個特制的系統中。然而,他們并沒有將每條客戶信息和客戶使用寬帶網絡的費用關聯起來,更糟糕的是,這里有成千上萬的實體需要關聯起來,所以他們沒有辦法靠人工處理。常規的腳本也無法解決這個問題,因為大部分的數據是手寫的,有大量的拼寫錯誤,并且因為該公司依照每個客戶對網絡的需求不同來調整相關費用,所以也并沒有具體的規律可循。于是,我和我的前同事制造了一個人工智能程序來為每一個實體進行有根據的推測。這個程序能夠一次性正確關聯90%的數據,而剩下的10%則與相關的錯誤信息相關聯,當然,有些資源數據無法關聯是因為可能根本沒有客戶在使用它!

所以到最后,到遇到真正的業務問題,無法找到簡單地解決方案,運用常規算法又會異常復雜時,我們會使用人工智能來解決。我們想要將人工智能當做我們工具箱中的一個工具,而最先意識到這件事的企業也將會占盡優勢,成為行業中的巨頭。

來自: http://dataunion.org/21909.html

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!