MySQL Sharding可擴展設計

jopen 12年前發布 | 26K 次閱讀 MySQL 數據庫服務器

一.背景    

    

    我們知道,當數據庫中的數據量越來越大時,不論是讀還是寫,壓力都會變得越來越大。采用MySQL Replication多master多slave方案,在上層做負載均衡,雖然能夠一定程度上緩解壓力。但是當一張表中的數據變得非常龐大時,壓力還是 非常大的。試想,如果一張表中的數據量達到了千萬甚至上億級別的時候,不管是建索引,優化緩存等,都會面臨巨大的性能壓力。

二.定義

    數據sharding,也稱作數據切分,或分區。是指通過某種條件,把同一個數據庫中的數據分散到多個數據庫或多臺機器上,以減小單臺機器壓力。

三.分類

    數據分區根據切分規則,可以分為兩類:
    (1)垂直分區:以表為單位,把不同的表分散到不同的數據庫或主機上。特點是規則簡單,實施方便,適合業務之間耦合度低的系統。
    (2)水平分區:以行為單位,將同一個表中的數據按照某種條件拆分到不同的數據庫或主機上。特點是相對復雜,適合單表巨大的系統。
   
    在實際情況中,有的時候把垂直分區和水平分區結合使用。

四.示意圖

    下面通過幾張圖來給出上面三種分區方式的直觀效果。
    (1)垂直分區
      MySQL Sharding可擴展設計
    (2)水平分區
      MySQL Sharding可擴展設計
    (3)聯合分區
     MySQL Sharding可擴展設計

五.注意事項

     下面我們所說的分區,主要是指水平分區。
    (1)在實施分區前,我們可以查看所安裝版本的mysql是否支持分區:
         mysql> show variables like "%partition%";
         如果支持則會顯示:
         +-------------------+-------+
         | Variable_name     | Value |
         +-------------------+-------+
         | have_partitioning | YES   |
         +-------------------+-------+

     (2)分區適用于一個表的所有數據和索引;不能只對數據分區而不對索引分區,反之亦然,同時也不能只對表的一部分進行分區。

     (3)分區類型:
           RANGE  分區:基于屬于一個給定連續區間的列值,把多行分配給分區。
           LIST  分區:類似于按RANGE分區,區別在于LIST分區是基于列值匹配一個離散值集合中的某個值來進行選擇。
           HASH分區:基于用戶定義的表達式的返回值來進行選擇的分區,該表達式使用將要插入到表中的這些行的列值進行計算。
           KEY  分區:類似于按HASH分區,區別在于KEY分區只支持計算一列或多列,且MySQL 服務器提供其自身的哈希函數。必須有一列或多列包含整數值。
          無論使用何種類型的分區,分區總是在創建時就自動的順序編號,且從0開始記錄。當有一新行插入到一個分區表中時,就是使用這些分區編號來識別正確的分區。

      (4) MySQL提供了許多修改分區表的方式。添加、刪除、重新定義、合并或拆分已經存在的分區是可能的。所有這些操作都可以通過使用ALTER TABLE 命令的分區擴展來實現.

      (5) 可以對已經存在的表進行分區,直接使用alter table命令即可。


六.參考文獻:
1.《MySQL性能調優與架構設計》
2.《MySQL 5.1參考手冊》
 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!