微軟AI技術新進展,可以基于圖片內容回答自然語言問題
最近, 據 ZDNet ,微軟在卡耐基梅隆大學的一個研究小組開發出一個新的 AI 系統,這個系統可以訓練機器識別圖像的內容,并回答自然語言提出的問題。例如,現在有一張狗坐在自行車籃子里的照片,這項技術用來回答,“什么坐在自行車的籃子里” 這樣的問題。
微軟的研究人員表示,回答這樣一個問題并不簡單,需要多步驟推理,具體解決方案是 “堆棧注意力網絡(Stack Attention Networks)”,圖片經過多層深度神經網絡進行 “注意力” 分析,計算出哪些區域與問題有關。單層 “注意力” 分析技術曾用于圖像自動字幕和機器翻譯。具體技術原理參加 他們的論文 。
這項技術未來可以用于實時識別并預測人的需求,例如,自行車頭盔上的攝像頭預警系統,這個系統會不停地問自己問題,諸如 “我的左邊是什么?”,“旁邊是不是有車要超我?”,“有沒有跑向我但我沒注意到的人?”,這些問題的答案可以用來提示騎車人,預防危險的發生。
前些天, Google 的自然語言處理剛剛取得突破 ,可以通過文字或語音識別出 “最高級”、“基于時間的” 查詢和一些復雜組合問題。
原創文章,作者:Yuri,如若轉載,請注明出處:http://36kr.com/p/5040135.html
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!