Google發布開源強化學習框架
據 VentureBeat 報道,強化學習是一種人工智能(AI)技術,它利用獎賞(或懲罰)來驅動代理朝著特定的目標前進。DeepMind 就是利用這種學習方式 AlphaGo。但是強化學習框架存在一些問題,比如需要花很多時間來掌握一個目標,而且總是不靈活,也不穩定。
針對真個問題,Google 提出一個替代方案:基于其機器學習庫 TensorFlow 的開源強化學習框架。該強化學習框架基于靈活性、穩定性和重現性三個基本原則開發,目前已發布在 GitHub 上。
除了該開源框架外,Google 還推出了一個網站,允許開發人員能快速將針對多個代理的培訓運行進行可視化。它還提供經過訓練的模型、原始統計日志和 TensorFlow 事件文件,用于與 TensorBoard 一起繪圖,TensorBoard 是 Google 開發的用于 TensorFlow 程序的可視化工具套件。
來自: www.pingwest.com
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!