非死book訓練機器人討價還價 教它們與人類談判
隨著亞馬遜 Echo 和谷歌 Home 的走紅,智能語音機器人越來越受到歡迎。但眼下,非死book 已經不滿足于研發一款可以聊天的智能語音助手,而是要訓練機器人與人類進行談判。
6 月 15 日,據科技博客 Techcrunch 報道,非死book 人工智能研究所(非死book Artificial Intelligence Research,簡稱 FAIR)的研究人員已經創建了人工智能模型,它們被賦予了與人類談判的能力,可以與人討價還價。
目前 FAIR 的研究人員已經開放了該模型的源代碼,并發表論文,介紹了該機器人所具有的談判能力。在論文中,研究人員表示,通過大量的訓練,對于具有不同目標的對話機器人,已經可以與其他機器人或人類進行從開始到結束的談判,并最終達成一致結果和目標。
非死book 研究人員指出,現實生活中人們經常需要面對的“討價還價”就是最常見的一種談判行為。他們從這一行為模式入手,開始教機器人如何分配物品,譬如五本書、三頂帽子、兩個球等等。每一場談判被限定在 10 次對話之內,如果 10 次對話結束后,沒有達成共識,那么雙方都不能得到物品。
為了達到訓練效果和進行大規模的定量評估,FAIR 團隊收集了一系列人與人之間討價還價的記錄供機器學習。這些案例詳細記錄了人們給一組物品定價并進行分配的過程。然后研究人員建立了一個遞歸的神經網絡,通過教它模仿人們的行為來學會談判。
工程師們還利用機器人與機器人的對話來改善學習結果,方法是讓一個機器人生成數據去“愚弄”另一個機器人。這個場景需要機器人與另一方建立對話模型,雙方間就交易展開談判,從而預判出對方對特定報價的反應,而采取具體應對措施,而非簡單的模仿。在訓練過程中,研究人員很快發現,機器人學會了一些談判策略,比如故意強調一些低價的物品,假裝讓對方認為該物品擁有更高的價值。
FAIR 團隊的工作人員向 Techcrunch 表示,他們訓練機器人的目的是教會他們防止做出不好的決策,而不是每次都作出最優的選擇。“就像你用日歷提醒自己開會,是為了保證會議能如期參加,而不是為了選在最好的時間開會。”工作人員稱。
在 2016 年的開發者大會上,非死book 的創始人兼首席執行官馬克·扎克伯格(Mark Zuckerberg)就像外界介紹過類似的應用場景,在這個場景中,人們通過機器人與企業互動,例如,訂購產品或獲得客戶服務幫助。
不過目前,FAIR 還沒有深入研究什么這種機器人的討價還價能力可能適用于哪些應用軟件,也沒有表示這種能力是否會在 非死book 的產品中出現。FAIR 在論文中指出,辯論、對話和談判的能力對進一步開發并提升聊天機器人是非常重要的,訓練機器人學會談判過程中的所有重要步驟都是打造個性化數字助理的關鍵。
來自: 澎湃新聞