AI 模型 GameGAN 重寫《吃豆人》,目標:看視頻就能學習的 AI
英偉達稱稍后會放出一個使用 AI 模型 GameGAN 復刻的《吃豆人》游戲,以致敬誕生 40 周年的街機版《吃豆人》。
根據英偉達發布的研究報告,GameGAN 目標是用神經網絡取代游戲引擎。
它不同于以往用 AI 做游戲的例子。之前的谷歌 DeepMind 和 Open AI 還是在現有游戲框架中,被用來“玩游戲”,相當于是智能生成一個游戲對手。比如 OpenAI 被用來在 Dota2 5v5 中對戰人類,OpenAI 2018 年通過學習人類演示,在蒙特祖瑪的復仇游戲中刷出了 74500 分的高分。
GameGAN 則被用來“創作”游戲,是對現有游戲代碼的取代。它在訓練過程中攝入大量游戲劇本和鍵盤動作,通過觀察場景和玩家的操作動作,預測下一幀游戲畫面,而不訪問底層游戲邏輯或引擎。
“當玩家按下左鍵的時候,這個 AI 會猜測畫面的變化,并且生成一個“看起來是角色在往左走”的圖像。 中間發生的事情,全部都在 AI 的黑盒中。 沒人知道 AI 是怎么理解玩家操作的,得到的只有最終的輸出結果。”
除了生成下一幀游戲畫面,GameGAN 還學習環境的內在動力學,“我們有興趣訓練一個游戲模擬器,它可以模擬環境的確定性和隨機性”。
GameGAN 包括動力引擎;記憶模塊;渲染引擎;對抗性損失、循環損失訓練和培訓計劃。
首先 GameGAN 要學習環境會如何跟隨用戶操作變化而改變,這涉及一些基本的規則,比如不能穿過墻壁。同時還要通過訪問歷史,產生一致性模擬。場景中的長期一致性實現通過記憶模塊實現,GameGAN 使用內存模塊,記住生成的靜態元素,如背景,并在需要的時候適當檢索。神經渲染引擎負責渲染模擬圖像。此外,對抗訓練用來完成圖像和視頻的合成任務,GameGAN 用對抗性訓練學習環境動力學,并產生真實的時間相關模擬。
這次復刻《吃豆人》,主要訓練的細節包括吃豆人的速度和移動能力;鬼魂的運作方式;吃豆人吃下大力丸后的變化;鬼魂與吃豆人相遇的場景。據了解,GameGAN 基于 PyTorch 開發,模型研發已經進行了 8 個月,關于復刻《吃豆人》只用了 4 天。
游戲開發商萬代南宮夢為此次訓練提供了總計幾百萬幀、50000 集的《吃豆人》劇本。該公司的 Koichiro Tsutsumi 表示:“在看到這個結果時,我們都感到震驚,大家都無法相信可以在沒有游戲引擎的情況下再現了南夢宮的經典游戲《吃豆人》。這項研究將幫助游戲開發人員加快新關卡、角色甚至游戲的開發。一想到這一點,我們就感到十分興奮。”
不過,復刻游戲只是開始,英偉達的目標是擴展模型來捕捉更復雜的現實世界環境。英偉達多倫多研究實驗室主任 Sanja Fidler 表示:“我們最終將訓練出一個 AI,其只需通過觀看視頻和觀察目標在環境中所采取的行動,就能模仿駕駛規則或物理定律。” 而 GameGAN 只是第一步。
Nvidia GameGAN Research:
https://cdn.arstechnica.net/wp-content/uploads/2020/05/Nvidia_GameGAN_Research.pdf