阿里研發實時計算平臺 每秒運算量將超千萬

jopen 10年前發布 | 4K 次閱讀 阿里

阿里研發實時計算平臺 每秒運算量將超千萬
資料圖

        阿里巴巴 11 月 6 日宣布,其大數據團隊自研的實時數據計算平臺 Galaxy ,目前每秒可運算數據超過 500 萬條,預計雙十一當天每秒運算量將超過 1000 萬條,日處理消息數將超過 1 萬億條。針對每一筆交易數據,系統將實時反復檢測 70 余次以保證數據質量。

        一分鐘成交破億,一千多萬人涌入天貓。這是 2013 雙十一購物狂歡節第一分鐘的戰況。這些數據在杭州淘寶城內的數據大屏實時播報。大屏上跳動的每個數字,來自于阿里內部 60 多個系統間的緊密合作:當你在以最快速度秒殺到雙十一熱賣商品的同時,這些系統已經完成了無數輪的數據采集、傳輸、加工、計算以及反饋到頁面的工作。這正 是阿里未曾公開的技術--如何在保障數據質量的前提下實現實時計算?

        Galaxy 是阿里巴巴自研的通用增量計算平臺,能提供從分鐘級別到秒級別、甚至毫秒級別延遲的實時數據計算能力。Galaxy 解決了計算通用性、開發成本、數據質量等諸多難題,并提供可擴展、規模化的集群服務能力。

        目前,Galaxy 每秒可計算數據已達 500 萬條,每日處理的記錄數超過 2500 億,日處理數據量近 2PB。想象一下:當你還在努力算出 1024×1024 等于多少時,這一秒鐘內 Galaxy 已經拿到數據、計算結束、交出結果這一整套流程 500 萬遍了。今年雙十一,用戶瀏覽、成交、手機 APP 等產生的數據量都將大規模增長。當天 Galaxy 的運算量預計每秒將超過 1000 萬,日處理消息數將超過 1 萬億條。

        阿里巴巴數據質量團隊介紹:“Galaxy 不光要算得快,還得保證不能算錯。”除了 Galaxy 之外,阿里研發了一套可以實時檢測線上數據的系統,能夠在 1 秒鐘以內完成從數據產生到校驗的過程,每筆交易可以實時建議 70 多次,以保障雙十一的數據不會算錯。

        比如,一個美國用戶在雙十一活動下單,剛付完款,可能由于國際間網絡突然閃斷,導致"已付款"狀態數據沒有傳輸回來。這時,呈現給買家的可能就 是"交易失敗"的狀態。但通過數據實時檢測系統,能在這個問題被消費者發現之前就開始報警進行處理。也許,還沒消費者回過神來,這個問題就已經被糾正,絲 毫感受不到"交易失敗"曾經出現過。

        此外,Galaxy 還設計了數據"防漏"措施,哪怕服務器突然宕機,也能保障數據不丟失,快速恢復后繼續工作。想象一下:如果在你跟朋友約好晚上看電影的時候,你突然發了一 場高燒昏厥過去,正常情況下,要去醫院才能治好,并且得休息好幾天。Galaxy 不僅能自我修復,而且還能將時光倒回到那個晚上,你和朋友繼續去看電影。

        目前,Galaxy 已逐步支撐阿里集團絕大部分的實時業務和應用,包括淘寶、天貓、阿里云、菜鳥、聚劃算、無線、搜索、廣告、數據魔方等業務提供實時計算服務。

來自: 新浪科技
                    <span id="shareA4" class="fl">                  
                        </span> 

</div>

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!