非死book的深度學習系統可造出以假亂真的圖像
在Google、微軟、百度等巨頭的推動下,人工智能技術的發展突飛猛進。能識別圖像已經不算什么本領了,現在Faebook的AI技術已經幾乎可以以假亂真,令受試者在40%的時間把計算機生成的圖樣當作是真的照片。
這項成果是由非死book人工智能實驗室的三位研究人員Soumith Chintala、Arthur Szlam、Rob Fergus與紐約大學庫朗計算機科學研究所的Emily Denton聯合完成的, 論文 題目叫做《用對抗網絡拉普拉斯金字塔的深度生成式圖像模型(Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks)》,非死book已經把論文提交到即將在蒙特利爾舉行的神經信息處理系統大會(NIPS,AI業界最著名的會議之一)上供討論。不 僅如此,非死book還打算稍后(可能下周末)將工作的代碼開源出來供大家參考。
簡單來說,非死book的AI技術可以自主生成一些含有飛機、汽車、小鳥等東西在內的場景圖像樣本令觀看者信以為真。非死book這項研 究成果的特別之處是,其AI采用的是無監督學習。以往包括Faebook在內的大公司和初創企業采用的普遍都是監督式學習,即需要利用大量帶標簽的數據去 訓練人工神經網絡,后者才能逐漸學會識別東西。比方說,給它看1000張貓的圖片,看多了之后AI才會逐步對貓建立模型并識別新的圖像。
Google的人工神經網絡可以根據原圖生成帶魔幻色彩的圖像,但非死book的Rob Fergus認為,自家生成以假亂真圖像取得的技術進展更高。
而無監督學習中樣本數據是不包含標簽的。這更接近于人學習認東西的方式。比方說,看過1、2部手機之后,我們很快就能認出第3部。在實現 上,非死book采用了兩套受訓神經網絡,一套是產生式的,賦予其隨機向量后就能生成圖像;而另一套則用來確定圖像是否看起來是真的。目前這套系統能 生成64x64像素的圖像。
由于不需要對訓練數據打上標簽,這項技術無疑可以幫助非死book更好地進行圖像、視頻、語音的識別工作,自然語言處理技術也可以相應提高。Google前兩天也公布了自己的一項 AI成果 ,利用人工神經網絡生成迷幻圖像。盡管看起來很酷,但非死book的研究科學家Rob Fergus認為,與非死book可生成以假亂真圖像相比,自家的技術顯然更難,取得的學術進展更多。當然,64x64的分辨率尚不具備使用價 值,非死book的下一步計劃是逐步提高生成圖像的分辨率,屆時,虛擬與現實的界限將進一步模糊,人類距離AI的圣杯越來越近了。
本文參考了多個信息來源: venturebeat.com 、 arxiv.org 、 googleresearch.blogspot.com