攜程癱瘓事件確認系員工誤操作所致
5 月 29 日消息,今天凌晨1:30 分,經攜程技術排查向新浪科技確認此次事件是由于員工錯誤操作導致。
對于恢復時間較長,攜程回應稱,因涉及的業務、應用及服務繁多,驗證應用與服務之間的功能是否正常運行,花了較長時間。攜程官方網站及 APP 已于 28 日 23:29 全面恢復正常。(伊凡)
以下為攜程對相關問題的說明:
1、事件發生原因
經攜程技術排查,確認此次事件是由于員工錯誤操作,刪除了生產服務器上的執行代碼導致。
2、為什么恢復時間那么長
一般來說,類似攜程這樣的大型網站承載著繁多業務,其后臺是一個由 SOA(面向服務)架構組成的龐大服務器集群,看似簡單的一個頁面背后由上千個應用子系統以及上千個 Web Service 組成,而每個應用子系統和每個 Web Service 之間都存在著相互調用的依賴關系。
發生事件后,攜程的技術人員除了需要恢復生產服務器上的執行代碼以外,還需要做的是恢復并確保每個應用子系統以及每個 Web Service 的功能正常,同時確保應用子系統與 Web Service 間的調用關系得以正常執行。
這種驗證性的操作需要攜程的工程師及運維人員通力合作,盡快恢復生產代碼并通過反復地、持續性地調試以確保應用子系統與 Web Service 功能的正常運行。
攜程再次保證,數據和數據庫并未受到此次事件的影響,用戶訂單數據也完整無損,請用戶放心并繼續使用攜程網站及 App。
3、如何杜絕此類事件的再次發生?
攜程在系統上做了改進,規范并杜絕技術人員錯誤刪除生產服務器上代碼的操作。
來自: 新浪科技
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!