谷歌的AI學會了如何畫畫,但還只是小孩子水平
谷歌去年推出過一款基于人工智能的網頁工具,能根據用戶的涂鴉來猜詞。目前,這些涂鴉正在被用于指導谷歌的人工智能如何去繪畫。谷歌的這項成果名為 Sketch-RNN,目前的繪畫水平與嬰兒相當。
為了開發 Sketch-RNN,谷歌大腦團隊研究員大衛·哈(David Ha)和道格拉斯·艾克(Douglas Eck)從谷歌的工具 Quick, Draw!中收集了 50 萬幅用戶的涂鴉。每當用戶在該應用中進行涂鴉時,應用不僅會記錄最終圖片,還會記錄用戶每一筆的順序和方向。最終數據能夠更完整地反映人類是如何繪畫的。
最終,大衛·哈和艾克獲得了 75 個門類 7 萬幅可用于訓練的涂鴉作品,包括“貓”、“消防車”、“花園”、“貓頭鷹”、“豬”、“人臉”和“美人魚”。他們的目標是開發出一種機器,能夠“以類似人類的方式繪制并生成抽象概念”。這一人工智能系統確實做到了這一點。在利用這些數據進行學習后,系統能根據人類的輸入去畫畫,如下圖所示:
根據倒數第二行圖片,可以發現,人工智能并不是簡單地模仿人工涂鴉的線條。這里作為輸入的貓有 3 只眼睛,但人工智能只是提取了概念,而不是涂鴉本身,并且知道 3 只眼睛是不正確的。
隨后,Sketch-RNN 還學會了在沒有初始輸入涂鴉的情況下繪制對象。
目前,已有一些人工智能系統能生成類似照片、具有真實感的畫面。在這樣的情況下,為何還要讓神經網絡學習涂鴉?大衛·哈和艾克表示,盡管涂鴉看起來只是小孩子的玩意,但代表了抽象和數據壓縮能力。他們認為,涂鴉“告訴我們,人們如何展現和重建周圍世界的畫面”。換句話說,涂鴉更富于人文意味。一旦教會人工智能去涂鴉,那么就可以將其應用于多種有趣的用途。Sketch-RNN 甚至也可以用于完成他人畫了一半的涂鴉,如下圖所示:
此外,Sketch-RNN 還可以將不同涂鴉合并在一起。在下方的圖片中,這一神經網絡被要求繪制“貓”和“椅子”合并后的東西。最終結果是奇怪的四不像。
Sketch-RNN 還可以用于繪制所謂的“隱藏空間插入”:觀察任意數量的涂鴉對象,以不同比率將這些對象合并在一起,創造出包含多個元素的新涂鴉。在下圖左側的涂鴉中,這一人工智能合并了 4 種不同的涂鴉:豬、兔子、螃蟹和人臉。
很明顯,這樣的涂鴉非常基礎,但用于繪制這些涂鴉的方法很有趣,也很有用。未來,類似 Sketch-RNN 的人工智能系統可以作為設計師、建筑師和藝術家的創意助手。如果某人對自己的繪畫或設計不滿意,那么可以讓人工智能去總結當前的成果,進而提出更多建議。計算機生成的圖像自身可能沒有太大用途,但可以給人類帶來靈感。
來自: 騰訊科技