Redis 集群方案介紹了
由于Redis出眾的性能,其在眾多的移動互聯網企業中得到廣泛的應用。Redis在3.0版本前只支持單實例模式,雖然現在的服務器內存可以到100GB、200GB的規模,但是單實例模式限制了Redis沒法滿足業務的需求(例如新浪微博就曾經用Redis存儲了超過1TB的數據)。Redis的開發者Antirez早在博客上就提出在Redis 3.0版本中加入集群的功能,但3.0版本等到2015年才發布正式版。各大企業在3.0版本還沒發布前為了解決Redis的存儲瓶頸,紛紛推出了各自的Redis集群方案。這些方案的核心思想是把數據分片(sharding)存儲在多個Redis實例中,每一片就是一個Redis實例。
下面介紹Redis的集群方案。
1.客戶端分片
客戶端分片是把分片的邏輯放在Redis客戶端實現,通過Redis客戶端預先定義好的路由規則,把對Key的訪問轉發到不同的Redis實例中,最后把返回結果匯集。這種方案的模式如圖1所示。
圖1 客戶端分片的模式
客戶端分片的好處是所有的邏輯都是可控的,不依賴于第三方分布式中間件。開發人員清楚怎么實現分片、路由的規則,不用擔心踩坑。
客戶端分片方案有下面這些缺點。
- 這是一種靜態的分片方案,需要增加或者減少Redis實例的數量,需要手工調整分片的程序。
- 可運維性差,集群的數據出了任何問題都需要運維人員和開發人員一起合作,減緩了解決問題的速度,增加了跨部門溝通的成本。
- 在不同的客戶端程序中,維護相同的分片邏輯成本巨大。例如,系統中有兩套業務系統共用一套Redis集群,一套業務系統用Java實現,另一套業務系統用PHP實現。為了保證分片邏輯的一致性,在Java客戶端中實現的分片邏輯也需要在PHP客戶端實現一次。相同的邏輯在不同的系統中分別實現,這種設計本來就非常糟糕,而且需要耗費巨大的開發成本保證兩套業務系統分片邏輯的一致性。
2.Twemproxy
Twemproxy是由推ter開源的Redis代理,其基本原理是:Redis客戶端把請求發送到Twemproxy,Twemproxy根據路由規則發送到正確的Redis實例,最后Twemproxy把結果匯集返回給客戶端。
Twemproxy通過引入一個代理層,將多個Redis實例進行統一管理,使Redis客戶端只需要在Twemproxy上進行操作,而不需要關心后面有多少個Redis實例,從而實現了Redis集群。
Twemproxy集群架構如圖2所示。
圖2Twemproxy集群架構
Twemproxy的優點如下。
- 客戶端像連接Redis實例一樣連接Twemproxy,不需要改任何的代碼邏輯。
- 支持無效Redis實例的自動刪除。
- Twemproxy與Redis實例保持連接,減少了客戶端與Redis實例的連接數。
Twemproxy有如下不足。
- 由于Redis客戶端的每個請求都經過Twemproxy代理才能到達Redis服務器,這個過程中會產生性能損失。
- 沒有友好的監控管理后臺界面,不利于運維監控。
- 最大的問題是Twemproxy無法平滑地增加Redis實例。對于運維人員來說,當因為業務需要增加Redis實例時工作量非常大。
Twemproxy作為最被廣泛使用、最久經考驗、穩定性最高的Redis代理,在業界被廣泛使用。
3.Codis
Twemproxy不能平滑增加Redis實例的問題帶來了很大的不便,于是豌豆莢自主研發了Codis,一個支持平滑增加Redis實例的Redis代理軟件,其基于Go和C語言開發,并于2014年11月在GitHub上開源。
Codis包含下面4個部分。
- Codis Proxy:Redis客戶端連接到Redis實例的代理,實現了Redis的協議,Redis客戶端連接到Codis Proxy進行各種操作。Codis Proxy是無狀態的,可以用Keepalived等負載均衡軟件部署多個Codis Proxy實現高可用。
- CodisRedis:Codis項目維護的Redis分支,添加了slot和原子的數據遷移命令。Codis上層的 Codis Proxy和Codisconfig只有與這個版本的Redis通信才能正常運行。
- Codisconfig:Codis管理工具。可以執行添加刪除CodisRedis節點、添加刪除Codis Proxy、數據遷移等操作。另外,Codisconfig自帶了HTTP server,里面集成了一個管理界面,方便運維人員觀察Codis集群的狀態和進行相關的操作,極大提高了運維的方便性,彌補了Twemproxy的缺點。
- ZooKeeper:分布式的、開源的應用程序協調服務,是Hadoop和Hbase的重要組件,其為分布式應用提供一致性服務,提供的功能包括:配置維護、名字服務、分布式同步、組服務等。Codis依賴于ZooKeeper存儲數據路由表的信息和Codis Proxy節點的元信息。另外,Codisconfig發起的命令都會通過ZooKeeper同步到CodisProxy的節點。
Codis的架構如圖3所示。
圖3Codis的架構圖
在圖3的Codis的架構圖中,Codis引入了Redis Server Group,其通過指定一個主CodisRedis和一個或多個從CodisRedis,實現了Redis集群的高可用。當一個主CodisRedis掛掉時,Codis不會自動把一個從CodisRedis提升為主CodisRedis,這涉及數據的一致性問題(Redis本身的數據同步是采用主從異步復制,當數據在主CodisRedis寫入成功時,從CodisRedis是否已讀入這個數據是沒法保證的),需要管理員在管理界面上手動把從CodisRedis提升為主CodisRedis。
如果覺得麻煩,豌豆莢也提供了一個工具Codis-ha,這個工具會在檢測到主CodisRedis掛掉的時候將其下線并提升一個從CodisRedis為主CodisRedis。
Codis中采用預分片的形式,啟動的時候就創建了1024個slot,1個slot相當于1個箱子,每個箱子有固定的編號,范圍是1~1024。slot這個箱子用作存放Key,至于Key存放到哪個箱子,可以通過算法“crc32(key)%1024”獲得一個數字,這個數字的范圍一定是1~1024之間,Key就放到這個數字對應的slot。例如,如果某個Key通過算法“crc32(key)%1024”得到的數字是5,就放到編碼為5的slot(箱子)。1個slot只能放1個Redis Server Group,不能把1個slot放到多個Redis Server Group中。1個Redis Server Group最少可以存放1個slot,最大可以存放1024個slot。因此,Codis中最多可以指定1024個Redis Server Group。
Codis最大的優勢在于支持平滑增加(減少)Redis Server Group(Redis實例),能安全、透明地遷移數據,這也是Codis 有別于Twemproxy等靜態分布式 Redis 解決方案的地方。Codis增加了Redis Server Group后,就牽涉到slot的遷移問題。例如,系統有兩個Redis Server Group,Redis Server Group和slot的對應關系如下。
Redis Server Group | slot |
1 | 1~500 |
2 | 501~1024 |
當增加了一個Redis Server Group,slot就要重新分配了。Codis分配slot有兩種方法。
第一種:通過Codis管理工具Codisconfig手動重新分配,指定每個Redis Server Group所對應的slot的范圍,例如可以指定Redis Server Group和slot的新的對應關系如下。
Redis Server Group | slot |
1 | 1~500 |
2 | 501~700 |
3 | 701~1024 |
第二種:通過Codis管理工具Codisconfig的rebalance功能,會自動根據每個Redis Server Group的內存對slot進行遷移,以實現數據的均衡。
4.Redis 3.0集群
Redis 3.0集群采用了P2P的模式,完全去中心化。Redis把所有的Key分成了16384個slot,每個Redis實例負責其中一部分slot。集群中的所有信息(節點、端口、slot等),都通過節點之間定期的數據交換而更新。
Redis客戶端在任意一個Redis實例發出請求,如果所需數據不在該實例中,通過重定向命令引導客戶端訪問所需的實例。
Redis 3.0集群的工作流程如圖4所示。
圖4Redis 3.0集群的工作流程圖
如圖4所示Redis集群內的機器定期交換數據,工作流程如下。
(1) Redis客戶端在Redis2實例上訪問某個數據。
(2) 在Redis2內發現這個數據是在Redis3這個實例中,給Redis客戶端發送一個重定向的命令。
(3) Redis客戶端收到重定向命令后,訪問Redis3實例獲取所需的數據。
Redis 3.0的集群方案有以下兩個問題。
- 一個Redis實例具備了“數據存儲”和“路由重定向”,完全去中心化的設計。這帶來的好處是部署非常簡單,直接部署Redis就行,不像Codis有那么多的組件和依賴。但帶來的問題是很難對業務進行無痛的升級,如果哪天Redis集群出了什么嚴重的Bug,就只能回滾整個Redis集群。
- 對協議進行了較大的修改,對應的Redis客戶端也需要升級。升級Redis客戶端后誰能確保沒有Bug?而且對于線上已經大規模運行的業務,升級代碼中的Redis客戶端也是一個很麻煩的事情。
綜合上面所述的兩個問題,Redis 3.0集群在業界并沒有被大規模使用。
5.云服務器上的集群服務
國內的云服務器提供商阿里云、UCloud等均推出了基于Redis的云存儲服務。
這個服務的特性如下。
(1)動態擴容
用戶可以通過控制面板升級所需的Redis存儲空間,擴容的過程中服務部不需要中斷或停止,整個擴容過程對用戶透明、無感知,這點是非常實用的,在前面介紹的方案中,解決Redis平滑擴容是個很煩瑣的任務,現在按幾下鼠標就能搞定,大大減少了運維的負擔。
(2)數據多備
數據保存在一主一備兩臺機器中,其中一臺機器宕機了,數據還在另外一臺機器上有備份。
(3)自動容災
主機宕機后系統能自動檢測并切換到備機上,實現服務的高可用。
(4)實惠
很多情況下為了使Redis的性能更高,需要購買一臺專門的服務器用于Redis的存儲服務,但這樣子CPU、內存等資源就浪費了,購買Redis云存儲服務就很好地解決了這個問題。
有了Redis云存儲服務,能使App后臺開發人員從煩瑣運維中解放出來。App后臺要搭建一個高可用、高性能的Redis服務,需要投入相當的運維成本和精力。如果使用云存儲服務,就沒必要投入這些成本和精力,可以讓App后臺開發人員更專注于業務。