微軟AI技術新進展，可以基于圖片內容回答自然語言問題

jopen 10年前發布 | 7K 次閱讀微軟

最近，據 ZDNet ，微軟在卡耐基梅隆大學的一個研究小組開發出一個新的 AI 系統，這個系統可以訓練機器識別圖像的內容，并回答自然語言提出的問題。例如，現在有一張狗坐在自行車籃子里的照片，這項技術用來回答，“什么坐在自行車的籃子里” 這樣的問題。

微軟的研究人員表示，回答這樣一個問題并不簡單，需要多步驟推理，具體解決方案是 “堆棧注意力網絡（Stack Attention Networks）”，圖片經過多層深度神經網絡進行 “注意力” 分析，計算出哪些區域與問題有關。單層 “注意力” 分析技術曾用于圖像自動字幕和機器翻譯。具體技術原理參加他們的論文。

這項技術未來可以用于實時識別并預測人的需求，例如，自行車頭盔上的攝像頭預警系統，這個系統會不停地問自己問題，諸如 “我的左邊是什么?”，“旁邊是不是有車要超我？”，“有沒有跑向我但我沒注意到的人？”，這些問題的答案可以用來提示騎車人，預防危險的發生。

前些天， Google 的自然語言處理剛剛取得突破，可以通過文字或語音識別出 “最高級”、“基于時間的” 查詢和一些復雜組合問題。

原創文章，作者：Yuri，如若轉載，請注明出處：http://36kr.com/p/5040135.html

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/news/view/1d6e5aa

微軟

微軟AI技術新進展，可以基于圖片內容回答自然語言問題

相關資訊

相關經驗

相關文檔