從1987到2011:Siri從幻想走向現實
楊曉宇許悅楊櫻
人類從來就不吝于幻想未來,但就像所有的革命一樣,只有所有需要的技術都在那里的時候,Siri 的出現才是必然。
從10月14日開始,“調戲 Siri”變成了一個流行的游戲:擁有 iPhone 4S 的人們問它各種古怪的問題;沒有 iPhone 4S 的人們則以圍觀取樂。
如果有人只是把它看成一個語音搜索工具或者游戲,那就太不把 Siri 放在眼里了—喬布斯在收購時就把 Siri 定義為“人工智能公司”。
人們已經為此等待很久了。
回到1987年,Siri 還不叫 Siri,它叫 Jill,長了一張聰明的面孔,是一位教授的助手。這位助手—順便說一句,他生活在一本打開的平板電腦中—為教授提供了各種幫助:搜索論文的時間;提醒他回母親的電話;幫他接通電話,并在通話過程中提供搜索、提醒……
那只是一個幻想,是1980年代末期蘋果公司發布了一系列對未來展望的視頻中的一段。
在那之后的35年里,隨著計算機技術的發展,人工智能的研究從來沒有停止過:它有各種名字,有時候叫“T3”,有時候叫“深藍”……最近它又叫 “沃森”—讓人興奮,但昂貴而且獨一無二。在這35年里,個人電腦已經越來越小,iPad 出現了;移動設備功能越來越多,iPhone 讓人們擺脫了鍵盤;移動網絡的速度越來越快,3G 也將成為歷史;自然語音的識別、強大的運算能力、搜索已經無處不在……一切技術都已經準備妥當。
2010年4月,蘋果公司收購了 Siri。Siri 一位聯合創始人 Dag Kittlaus 寫下了一句話:“我們忙著搞下個大事情……很大很大。”
確實很大,Siri 來了。
它讓人們第一次有機會去測試自己的個人助理到底是否能通過“普魯斯特測試問答”。現在,答案是“不能”。但將來,Siri 的行為是否確實符合“機器人三原則”才是真正的問題—不過,有可能那時候它的名字已經不叫 Siri 了。
Siri 是如何成為 Siri 的?
Long long ago
人類最初的幻想為后來的機器人提供了感性的基礎。雖然那時候它還只是一個形象,但先要有足夠的想象……
3000多年前中國偃師的“伶人”算得上是最早有記載的“機器人”。但真正能被稱為“機器人”的,還是公元前兩世紀的古希臘人發明的“自動機”:它會自己開門,還可以借助蒸汽唱歌……18世紀時,對機器人的幻想越來越常見,《木偶奇遇記》、《浮士德》中都出現過機器人的形象。人們希望有那么一種機械,具有人的形象,能為自己提供各種服務—但此時,人類并沒有考慮過這種可以端茶、唱歌的機械是否需要思考。
1956
人工智能成為科學,組成 Siri 的所有元素這個時候實際上已經全部出現了。
1950年10月,圖靈發表了著名的“圖靈測試”,開創了計算機科學的重要分支─人工智能。但真正確定這一研究領域則是在1956年。這年,美國達特茅斯大學的青年助教麥卡錫、哈佛大學明斯基、貝爾實驗室的香龍、IBM 公司信息研究中心羅切斯特一起發起了一次學術研討會議,正式確定了人工智能(Artificial Intelligence)成為獨立的研究領域。從這天起,AI 就跨越了計算機科學、哲學、心理學以及社會學,成為了綜合的學科。
1983
Siri 未來是什么形式是由 Motorola 的這次技術進步決定的。
摩托羅拉 Motorola DynaTAC 8000X 成為世界上第一部手機。以手機為主的移動設備開始進入人們的日常生活。由于帶寬和硬件的限制,當時的手機只能支持語音通話。就像摩爾定律所描繪的一樣,隨著芯片運算能力的迅速提高,以及更多的移動電話制造公司進入這一領域,手機慢慢變小,便于攜帶。起初那個磚頭大小的手機,為人工智能提供了一個硬件平臺和可能的發展方向—移動和個人化。
1987
運算的核心是個人電腦,PC 革命是 Siri 的核心。
1980年代,電腦世界里最大的革命—個人電腦開始普及。在大型電腦最終進入個人書桌成為可能后,以前人們的幻想開始成為可能。1987年,蘋果公司發布了對未來的展望視頻,平板電腦和其中的 Jill—這位聰明的助理—成為人們對人工智能進入日常生活的具體設想。隨著這種幻想變為現實的可能性的增加,人們開始探討人工智能的倫理道德問題。阿西莫夫的“機器人三大定律”正式成為 AI 的道德標準。
1990
數據通信,數字管理讓 Siri 有了具體的“工作”。
FCC 批準采用蜂巢網絡技術,這使得移動網絡不僅可以支持語音通話,還可以進行數據通信。3年后,短信開始出現。2000年5月,國際通信聯盟發布了第三代移動通信技術(3G)。這一標準使得移動設備可以進行高速數據傳輸。此后,以黑莓為代表的 PDA 進入了人們的生活。這意味著人們不僅需要一個可以攜帶的電話,更需要一個可以攜帶的個人助理。1999年,Siri 的創始人之一 Adam Cheyer 在 SRI 開始進行與機器進行語音交流的研究項目。
2003
找到 Siri 發展所限制的條件:如帶寬、數據通信以及處理。
美國國防部高級研究所成立了一個把人工智能轉化為生產助手的相關研究項目 CALO,研發一種“人格化和有認知能力的耐用輔助性機器”,而負責這一項目的是斯坦福研究院(SRI),其中“Personal Assistant that Learns”(PAL)是獨立研究認知能力系統的子項目。2002年,當時的研究員 Adam Cheyer 在一份關于“無線和移動電腦的解決方案”的 PPT 中提到了移動帶寬限制了智能搜索、網絡服務整合的發展。
2007
Siri 已經實現了。這個項目將以前零散的思路完整化。
CALO 項目結束后,負責 CALO 項目的 SRI 研究員 Adam Cheyer、Norman Winasky 以及其他伙伴共同為 PAL 技術成立了獨立的開發公司 Siri。公司成立之后,Adam Cheyer 的團隊繼續做了大量關于機器人學習能力和信息管理能力的研究。但他此時的重點已經轉移到了 AI 在移動設備上提供個人服務的應用。Adam 為 Siri 下了一個定義:它是各種技術的整合,包括對話、自然語言理解、視覺、演說、機器學習、制定計劃、理性思考等等。
2007
帶寬、處理器都還差那么一點,但 Siri 的平臺搭建完畢了。
蘋果發布了第一款 iPhone。它不僅使手機擺脫了鍵盤和帶寬的束縛,采取觸摸屏和3G 網絡技術,更大的意義是它具有強大的運算速度,使得智能手機變為真正的終端,整合各種個人服務成為可能。App Store 開創了一種全新的手機應用模式,使得更多的人加入其中,為其提供更多的服務。第二年,Siri 整合更多網絡服務并進入了 APP Store,可以運行在3GS 上。聯合創始人之一的 Norman 說:“Siri 的人工智能需要使用大量的數據,大量的運算能力和網絡連接。”但,限于3GS 的運算速度,此時的 Siri 還不會說話,只能通過文字進行回應。
2010
一個成熟的產品需要強有力的推手,蘋果出現了。
4月,Siri 被蘋果公司收購,隨之宣布取消在 iPhone 手機以外所有其他系統版本的研發。雖然收購價格并沒有對外公布,但當時 Siri 的估值大約在2億美元左右。在此后,蘋果公司再次擴充了 Siri 能力,使其可以使用更多的系統基本的功能,包括使用 Nuance 的語音識別技術。但 Norman 認為,對于 Siri 來說,語音只占很小的一部分,甚至并沒有那么重要,一旦有更好的語音識別技術出現,Siri 可以很容易更換一個新的。
2011
10年之后,我們看第一代 Siri,可能跟看1984年的 Macintosh 一樣—它未免太幼稚了!但好在開始了。
美國當地時間10月4日,蘋果公司發布 iPhone4S。在經歷了最初的失望后,人們開始意識到,除了更快的運算速度之外,Siri 并不僅僅是一個語音系統或者搜索系統,它意味著整合了網絡服務的人工智能開始進入人們的日常生活。短短十天的測試后,人們意識到,現在的 Siri 還只是“弱人工智能”,并未具備“真正能夠推理和解決問題”的能力。但 Siri 的基礎是建立在 iCloud,亦即云計算的支持上的。一周后,寶馬宣布將在自己的汽車上支持 Siri 技術。在更多公司和服務加入對 Siri 的支持后,Siri—這個“個人智能助理”的雛形將會成為真正的“個人智能助理”。
來自: 第一財經周刊