美團點評的Atlas實踐

KennyWheat 9年前發布 | 34K 次閱讀 數據庫 集群/負載均衡

本文整理自美團點評技術沙龍第10期:數據庫技術架構與實踐。

美團點評技術沙龍由美團點評技術團隊主辦,每月一期,每期沙龍邀請美團點評及其它互聯網公司的技術專家分享來自一線的實踐經驗,覆蓋各主要技術領域。

本次沙龍主要圍繞數據庫相關的主題,內容包括美團數據庫自動化運維系統構建、點評側MySQL自動化服務平臺RDS、美團數據庫中間件、和小米高級DBA帶來的Redis Cluster的大規模運維實踐。

概述

這次分享的主要內容包括6個部分:

  • 第一是我的簡單介紹一下美團點評Atlas;
  • 第二部分,會介紹一下美團點評Atlas的整體架構;
  • 第三個是美團點評Atlas的主要模塊,主要模塊介紹我們美團點評在上面的主要工作;
  • 第四個部分是上線的現狀;
  • 第五個部分是我們后續的一些安排,未來的計劃;
  • 最后是QA的部分。

MTAtlas的優點

首先介紹一下為什么要使用Atlas:

  • 使用Atlas之后,應用程序只需要在連接串中設置Atlas的地址,不需要關注整個數據庫集群的結點;
  • Atlas內部實現負載均衡,讀寫分離;
  • Slave上下線的操作由DBA在自動化運營系統上點一下鼠標就能夠完成。

這樣極大的減輕了DBA和應用開發人員的工作;而沒有Atlas的情況下,這些工作是由RD來實現的,引入Atlas對于系統的可管理性和便利性都有非常大的幫助。

MTAtlas的軟件模塊

介紹Atlas的軟件模塊。軟件模塊分三層:

  • 第一層是一個訪問控制,包括用戶處理,IP過濾等等的功能;
  • 中間層是一個SQL處理的過程,包括SQL解析,SQL重寫,和SQL執行;
  • 第三層就是一個主要和DBA連接相關的一個模塊,像讀寫分離,負載均衡,連接池;
  • 另外還有三個模塊是貫穿整個三層的: 第一是連接的管理,負責管理收發數據的底層連接;第二是日志的管理,第三個是監控管理。

MTAtlas連接改進

首先介紹一下連接的管理:根據我們鏈路比較長的特點,著重添加了對于連接異常的檢測和處理,包括:

  • Atlas上游和MGW交互的連接檢測;
  • Atlas下游和MySQL連接的檢測;
  • Atlas所在機器的連接檢測。

MTAltas SESSION級變量

SQL處理模塊中增加了SESSION參數的功能: 客戶端分配一個DB連接的時候,如果二者SESSION級參數不一樣時,首先做一個校正,校正之后才會真正執行查詢。

MTAtlas連接池改進

連接池的管理中做了這樣的修改:將鏈表改成Hash表,其中Hash鍵是用戶名,Hash值是以用戶身份建立的連接的一個鏈表。如下圖把連接按用戶來分,client分別會分到各自user建立的db連接,二者互不影響,既保證了查詢的正確性,又保證了較高的性能。

#MTAtlas訪問控制

下面講一下訪問控制模塊,是在我們整個軟件模型的第一層。

  • 第一個是增加了一個SQL過濾的功能:
    • 該功能由黑名單的方式實現,黑名單的形式是如下邊兩個語句;
    • 黑名單可以根據執行的頻率,執行的時間來自動的添加,其中頻率時間,都是可以根據自己的需求動態修改的,另外我們也提供了一個手動添加黑名單的功能。
  • 第二個個是根據后臺db的thread running進行負載均衡,每當分配到一個后臺的連接的時候,先檢查后臺的Thread running數,直到有一個thread running數在我閾值之內的時候才真正去分配。
  • 第三個就是用戶IP限制,我們限制了用戶的host地址,相當于進行一個權限的控制。
  • 最后一個就是從庫流量配置,我可以指定某一個用戶只能訪問某幾個從庫,或者反過來說某幾個從庫只允許某幾個用戶訪問,這樣可能在一個更細的力度上對數據庫的資源進行分配。

MTAtlas監控模塊

MTAtlas的監控體系實現了一個從無到有的過程,目前主要監控一些Atlas內部運行相關的一些參數:

MTAtlas Sharding改進

對于sharding版本,做了如下的改進:

  • 首先我們把分庫變成分庫分表,并且提供了5種分庫分表的方式;
  • 第二個是改進了Lemon基本上兼容MySQL語法;
  • 第三個是有限支持單個庫內部的JOIN,經過Lemon解析后,發現涉及的表都是在同一個庫,那么表的JOIN是支持的;
  • 同樣的道理,單庫的事務也是支持的。
  • 最后一個就是增加錯誤處理:在一個庫上面執行出錯的時候,會相應有一些rollback的機制,來處理一些異常情況導致的執行失敗。

Q:這方面能大概講一下怎么去改進的?

A:首先是一個語法的支持,我們就是把中間不支持語法的支持,這樣的話有些復雜的查詢,我們可以通過這個語法來進行一些,比如說where條件的分析,可以知道分布分表的情況,然后就是表的替換。

MTAtlas上線現狀

和大家分享一下上線的現狀:從2015.5上線第一個版本后到現在已經有87%的服務組接入了MTAtlas, MTAtlas也已經經歷了5個版本的迭代。

#MTAtlas未來計劃

最后講一下未來的計劃:

  • 第一個就是更強大的SQL處理:
    • 增加一些SQL優化,Row cache的功能;
    • 分庫分表全面的SQL支持,如聚集,排序;
    • 更全面的連接上下文信息;
  • 第二:監控管理要結合自動故障處理,真正把監控的信息智能化;
  • 第三:下一個是和我們美團點評自己的MHA融合,支持自動故障切換;
  • 第四:支持分布式事務。

 

來自:http://tech.meituan.com/atlas-introduction.html

 

 本文由用戶 KennyWheat 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!