麻省理工研究人員開發出可預測人的圖片記憶的算法

麻省理工學院計算機科學和人工智能實驗室 (CSAIL) 的研究人員發明了一種算法,他們聲稱這種算法能夠預測一張圖片被記憶的程度,精確度幾乎和人類的一樣——也就是說,他們的技術可以預測一個人記住或者忘記一張特定照片的可能性。
據研究者稱,該算法的表現要比現有的算法高出 30%,與人類平均水平相比只差幾個百分點。
該研究團隊 在網上 放了一個該算法工具的演示版,你可以上傳你的自拍照到這個工具中,然后你會得到該圖的記憶分數,熱度圖則會顯示記憶程度不同的區域。他們還發表了一篇關于這個研究論文,你可以 在這里找到 。
這里有一些我通過他們的 MemNet 算法跑出來的照片圖例,這些圖都被打了分,熱度圖則分析了最難忘和最易忘的圖片區域。
考慮到照片和圖片分享就是社交網絡的現金流,該算法的潛在應用的確是非常廣泛。任何能夠幫助人們加深對視覺信息處理方式的理解,更好地了解信息對記憶的影響的事物都大有用處。
該研究團隊表示,他們計劃在未來發布一款應用,允許用戶調整圖像來提升圖片的影響力。因此該研究未來可用于加強圖片濾鏡功能,濾鏡的作用將不再只是美化人臉,讓人們更上鏡,而是有可能通過調整一些元素,讓照片更加令人難忘。
除了幫助人們給自己的照片增加持久印象,該團隊還設想利用該算法來加強廣告/營銷內容,改善教學資源,甚至是助力與健康有關的應用,那些旨在改善人們的記憶能力的應用,或者是用作一種診斷錯誤記憶的方法,也可用于診斷特定的醫療問題。
MemNet 算法是通過深度學習人工智能技術創造出來的,用來自幾個不同數據集的成千上萬張標記圖像作為訓練數據,所有這些數據集包括 LaMem 在內均由 CSAIL 開發,其中 LaMem 包含 6 萬張圖片,每張圖片都帶有詳細元數據注釋,標明了受歡迎程度和情緒影響等特性。
該團隊為了鼓勵未來的研究,將 LaMem 數據庫發布并且發表了研究論文,以此鼓勵深入研究探索計算機領域中未曾研究過的主題。
在被問到深度學習算法所識別到的究竟是什么樣的圖像模式,從而預測記憶程度的時候,麻省理工學院 CSAIL 的博士生阿迪蒂亞·科斯拉(Aditya Khosla),同時也是一篇相關論文的第一作者這樣告訴 TechCrunch:這是一個非常難以回答的問題,也是十分活躍的研究領域。雖然深度學習算法非常強大,能夠識別記憶程度不同的圖像模式,但是要了解清楚算法所識別的特征究竟是哪些還是相當具有挑戰性。
“在一般情況下,該算法會利用圖像中的對象和場景進行預測,但它究竟是如何做到這一點的還難以解釋。一些初步分析表明,(暴露出的)身體部位和面部往往會被很好記住,而顯示室外場景如海灘或地平線等的照片比較容易被遺忘。”
該研究還曾將圖片逐張展示給人們看,在這些人見到之前見過的圖像時,讓他們按下按鍵,從而為這些圖片創建記憶分數,然后用這些圖片訓練算法。據科斯拉說,該團隊從亞馬遜土耳其機器人(Amazon Mechanical Turk)眾包平臺找到了大約 5000 人來看圖,LaMem 數據集中每張圖片平均被 80 個人看過。
就缺點而言,該算法目前對于沒有訓練過的圖片的預測性不如訓練過的圖片好——所以它現在在自然圖片上的表現要好些,而在標志或線條圖上表現就不那么好了。
“因為它看不到顏色、字體等的變化對標志的記憶性的影響,所以它對這些圖片的理解有限,”科斯拉說道。“但解決的方法就是獲取更多這樣的數據,我們也希望在不久的將來能有進一步的探索——為了更好地理解這些圖,去獲得某些特定領域的專業數據,也許未來這些還會有商業用途。當前我們搜集數據的領域之一就是人的面孔。”
該團隊早先還曾開發出一套用于預測 面部記憶指數 的相似算法。
科斯拉在談到未來 MemNet 應用將會如何工作時表示,基于算法輸入對圖像進行調整的應用有很多,不過要確保最終的照片賞心悅目卻是件難事。他還指出,“最簡單的方法是利用熱點圖,把不易記住的區域都模糊處理,突出易于記住的區域,也可以用一個類似 Instagram 的濾鏡特殊處理或是特別裁剪一下。”
“復雜的方法包括添加或刪除圖像中的對象,從而自動改變圖像中讓人更容易記憶的內容——但你也可以想得到,這是非常難以實現的 ——我們必須確保對象大小、形狀、姿勢等等與加入的場景相匹配,避免看起來像是 Photoshop 技術不行。”
研究人員下一步將嘗試升級他們的系統,讓系統能夠預測特定的人的記憶。他們還希望能夠個性化系統,讓它能夠更好地為特定的專業領域,如零售服裝和標識設計服務。
在未來能夠通過算法預測人們對圖像的記憶之前,研究人員也不清楚還需要給人們展示的訓練圖片的數量。“我們仍在研究這個問題,”科斯拉說。
翻譯:曹木
MIT Researchers Train An Algorithm To Predict How Boring Your Selfie Is
來自: http://techcrunch.cn/2016/01/03/memnet/