首個應用到大規模真實工業場景的神經網絡控制系統在谷歌上線了
英文原文:Safety-first AI for autonomous data centre cooling and industrial control
即便深度學習和其它機器學習方法近幾年已經取得了不小的發展,但是把它們直接應用在真實工業場景中、讓它們直接控制工業系統還未曾見到。深度學習本身缺乏魯棒性、面對新狀況難以預測行為等一些特性固然是重要的掣肘之處,如何讓算法逐步提高控制范圍、協調與人類的協作方式也是難題。DeepMind 和谷歌最近就做出了新一步嘗試,取得了不小的成功,然后在 DeepMind 博客上進行了介紹。雷鋒網 AI 科技評論編譯如下。
我們人類社會面對的許多緊迫問題中,有許多問題還在變得越來越復雜,所有人都急切地想要找到好的解決方法。對于 DeepMind 和谷歌來說,他們相信如果人類可以把 AI 作為探尋新知識的工具加以利用,找到解決方法就會容易得多。
2016 年時,DeepMind 和谷歌聯手開發了一個基于 AI 的動作推薦系統,向負責維護、調節冷卻系統的數據中心運營人員推薦不同狀況下的應對方法,它讓谷歌當時已經具有很高能源效率的推薦系統數據中心向前更進了一步。他們的出發點也很簡單,為了應對全球氣候變化,大型能耗場所的一點點小改進也能在在減少能源消耗、減少二氧化碳排放方面有重大影響。
最近,DeepMind 把這個系統升級到了一個全新的級別上:不再像原來的系統那樣向人類推薦一些動作,然后由人類去完成,AI 系統現在會直接控制數據中心的冷卻系統,當然了它也仍然受到數據中心運營人員的專業監控。這是首個基于云的控制系統,已經在多個谷歌的數據中心中安靜地運行、持續地節省能源。
工作方式
每隔 5 分鐘,這個基于云的 AI 會從數據中心的數千個傳感器中采集數據,獲得數據中心冷卻系統的狀態快照,然后把它輸入深度神經網絡。這個網絡會預測各種可能的操作的不同組合會如何影響數據中心的能量消耗。然后 AI 就會就會在滿足魯棒安全性限制的條件下判斷出一組能夠最小化能源消耗的動作。這些動作的判斷結果接下來會被發回給數據中心,由本地的控制系統驗證并執行。
這種系統運行的想法其實來自于在數據中心使用原來那個 AI 推薦系統的操作人員。他們告訴 DeepMind 的研究人員們,雖然系統給他們教了一些最新最好的操作技巧,比如讓冷卻介質覆蓋更多的設備,而不是更少,但是實現這些推薦操作其實需要花費非常多的操作精力和長期規劃。所以他們自然地就很想知道,能不能不需要人來出力就達到類似的能源節省效果。
現在他們就可以很高興地宣布,答案是能。谷歌的一位數據庫操作人員表示:「我們希望可以節省能源,同時也降低操作人員的工作強度。自動化的系統就可以讓我們以更高的頻率執行更細粒度的行動,同時出的錯誤還更少。」
兼顧安全性和可靠性
谷歌的數據中心里一般都有上千臺服務器,它們支撐著谷歌搜索、Gmail、油Tube 等用戶們每天都會使用的服務。確保這些服務可以可靠、高效地運行是最關鍵的一件事。DeepMind 和谷歌一起設計 AI 智能體以及背后的控制界面時,都是帶著安全、可靠的思維從頭設計的,還使用了 8 種不同的機制確保系統能夠總是能夠按照預期行動。
他們使用的方法里,其中一種較為簡單的是估計不確定性。對于總計上億個可能的動作中的每一種,AI 智能體都需要計算自己認為這是一個好的動作的信心。估計出來信心太低的動作就不去考慮了。
另一個方法是兩層驗證。AI 計算出的最優行動首先需要根據一個內置的、由數據中心運營人員們制定的安全限制清單做檢查。計算的結果通過檢查、從云端發送到實際的數據中心之后,當地的控制系統還會再次把指令根據自己的一套安全限制清單再檢查一遍。這種冗余設計的檢查流程確保了系統的運行總是在當地的限制之內的,操作人員們也總是對操作的邊界有完全的控制。
最重要的是,谷歌的數據中心總是會受到人類的完全控制的,人類隨時可以選擇退出 AI 控制模式。這時候,控制系統會自動從 AI 控制無縫地切換到基于現代自動化工業使用的基于現場規則的以及啟發式設計的控制系統。
他們設計的其它安全機制如下圖:
連續監控、自動錯誤重啟、平滑切換、兩層驗證、不間斷通訊、不確定性估計、規則與啟發式設計的備用控制系統、人類指令優先
越用越節省能源
相比于原來的動作推薦系統需要操作人員自己檢查以及實施推薦的動作,新的 AI 控制系統是自己直接實現這些動作的。DeepMind 和谷歌的研究人員在開發它時也有有意識地把系統的優化邊界設定到了一個更窄更小的策略中,讓它把安全和可靠作為首要目標,也就是說對于節約能源的目標來說,它需要在過于節約導致的不穩定風險和優化不足的低反饋之間找到平衡。
雖然只上線了幾個月時間,這個系統已經可以穩定地節約平均 30% 左右的能源,而且他們還期待系統未來可以改善更多。這是因為隨著數據更多,系統的優化判斷能力也會變得更強,如下圖。隨著技術越來越成熟,DeepMind 和谷歌的研究人員未來也會把系統的優化邊界設置得寬松一些,來達到更好的能源節約效果。
這個 AI 直接控制的系統時不時找到一些新的方法管理冷卻系統,有一些方法甚至讓數據庫操作人員覺得驚訝。與這個系統緊密協作的一位谷歌數據中心運營人員就驚訝道:「這個 AI 會利用冬天外面比較冷的特點,產生比平時更冷的冷卻水,然后減少了給數據中心降溫所需的能源消耗。規則是不會自己變得越來越好的,但是 AI 可以啊。」
對于已經安全運行、獨立運行、降低能耗的 AI 直接控制系統,DeepMind 和谷歌都覺得非常激動。不過,在數據中心中使用這樣的系統才僅僅是個開始。在長遠的未來,他們認為還有很多的潛力把這樣的技術運用在其他工業場景中,也就可以在更大的規模上幫助對抗氣候變化。
來自: 雷鋒網