關于 MongoDB 復制集的幾個問題

jopen 10年前發布 | 20K 次閱讀 MongoDB NoSQL數據庫

原文 http://segmentfault.com/a/1190000004025139

為什么要使用復制集

1.備份數據通過自帶的 mongo_dump/mongo_restore 工具也可以實現備份，但是畢竟沒有復制集的自動同步備份方便。

2.故障自動轉移部署了復制集，當主節點掛了后，集群會自動投票再從節點中選舉出一個新的主節點，繼續提供服務。而且這一切都是自動完成的，對運維人員和開發人員是透明的。當然，發生故障了還是得人工及時處理，不要過度依賴復制集，萬一都掛了，那就連喘息的時間都沒有了。

3.在某些特定的場景下提高讀性能

默認情況下，讀和寫都只能在主節點上進行。

下面是MongoDB的客戶端支持5種復制集讀選項：

primary：默認模式，所有的讀操作都在復制集的主節點進行的。
primaryPreferred：在大多數情況時，讀操作在主節點上進行，但是如果主節點不可用了，讀操作就會轉移到從節點上執行。
secondary：所有的讀操作都在復制集的從節點上執行。
secondaryPreferred：在大多數情況下，讀操作都是在從節點上進行的，但是當從節點不可用了，讀操作會轉移到主節點上進行。
nearest：讀操作會在復制集中網絡延時最小的節點上進行，與節點類型無關。

來源： http://docs.mongoing.com/manual-zh/core/read-preference.html

不推薦在從節點上進行讀操作，因為從節點上的數據可能不是最新數據（主要原因）。

在從節點上進行讀操作的場景很有限，官方手冊中寫明了適用的場景和不推薦從節點讀操作的多個原因： http://docs.mongoing.com/manual-zh/core/read-preference.html#use-cases

說說我自己的看法：復制集并不是為了提高讀性能而存在的，除了個別場景，不推薦在從節點上進行讀操作。如果想提升讀性能，那么請使用索引和分片。插一句，如果數據規模不大，就沒必要使用分片了。我們線上數據庫中單個集合記錄有將近 2 億條，性能還比較 OK（當然，機器配置也不差，而且上面就只跑了一個 Redis 和一個 MongoDB）。

如何部署復制集

請看手冊： http://docs.mongoing.com/manual-zh/tutorial/deploy-replica-set.html

如何在程序中使用 MongoDB 復制集故障自動轉移的特性

以 PHP 的 mongo 驅動為例。

$client = new MongoClient('mongodb://192.168.1.2:27018,192.168.1.3:27019,192.168.1.4:27020', array('replicaSet' => 'rs0'));

這樣配置后，如果只是其中一臺 MongoDB 服務掛斷后，剩余的節點會自動選舉出新的主節點，程序還是可以繼續正常運行。在選舉的過程中，程序還是會拋出異常的，盡管選舉過程很快，但是為了程序的健壯性，必須考慮異常的處理。當然，如果選舉不出新的主節點，那么整個 MongoDB 就不可用了。（根據上面講的，如果復制集的讀選項是配置的primaryPreferred。如果沒有了主節點，但是從節點還可用的話，那么讀操作將轉移到從節點上去，這樣整個 MongoDB 復制集還能提供讀操作服務）

其實如果指定了復制集名'replicaSet' => 'rs0'，那么就算不列出所有節點地址，僅寫一個有效節點地址，mongo 驅動會自動獲取到所有有效節點，$client->getHosts()方法可以查看所有有效節點的地址。

但是如果你只寫了一個節點地址，剛好是那個節點掛掉了，那就連不上了。 所有我建議配置完整的節點地址列表 。

同步的原理是什么

開啟復制集后，會在local庫下生成一個集合叫oplog.rs，這是一個有限集合，也就是大小是固定的。每次對數據庫的寫操作都會被記錄到這個集合里面。復制集中的節點就是通過讀取其他節點上面的 oplog 來實現數據同步的。

舉個例子：用客戶端向主節點添加了 100 條記錄，那么 oplog 中也會有這 100 條的 insert 記錄。從節點通過獲取主節點的 oplog，也執行這 100 條 oplog 記錄。這樣，從節點也就復制了主節點的數據，實現了同步。

需要說明的是：并不是從節點只能獲取主節點的 oplog。

為了提高復制的效率，復制集中所有節點之間會互相進行心跳檢測（通過ping）。每個節點都可以從任何其他節點上獲取oplog。

還有，用一條語句批量刪除 50 條記錄，并不是在 oplog 中只記錄一條數據，而是記錄 50 條單條刪除的記錄。

oplog中的每一條操作，無論是執行一次還是多次執行，對數據集的影響結果是一樣的，i.e 每條oplog中的操作都是冪等的。

什么情況下需要重新同步

在上一個問題中得知：oplog 大小是固定的，而且 oplog 里面的記錄數不一定和節點中的數據量成正比。那么，新記錄肯定會將前面的老記錄給覆蓋。

如果，有天一個從節點掛了，其他節點還在正常運行，繼續有寫操作，oplog 繼續增長。而這個掛掉的節點一直不能從其他節點那里同步最新的 oplog 記錄，當其他節點的 oplog 已經發生的覆蓋。即使這個從節點后來恢復了正常，也不會和其他節點保持數據一致了。因為，覆蓋的就永遠回不來了。

那么，這個時候就得重新同步了。恩，回不去的就永遠回不去了，再找個新的重新開始吧。(逃

如何重新同步

參見：復制集成員的重新同步

什么時候應該使用投票節點

當復制集中有偶數個節點時，應該再加一個投票節點，用于打破投票僵局。

比如：我線上共有3臺服務器，其中1臺是作為 Web 服務器；其余2臺作為 DB 服務器，各部署了1個MongoDB節點，構成了2個節點的復制集。這個時候，我并沒有多余的機器了。在這個情況下，如果任意一臺 DB 服務器上的 MongoDB 掛了，那么另外一臺的 MongoDB 必然變為 SECONDARY 節點，那么就意味著 MongoDB 是不可用的了。為了避免這種情況，提高服務的可用性，可以在 Web 服務器上部署一個投票節點。投票節點并不存儲數據，因此不能升職為 PRIMARY 節點，它對于硬件資源要求很低，并不會對 Web 服務器上的其他程序產生太大影響。這種情況下，如果任意一臺 DB 服務器掛了，另外一臺服務器上的 MongoDB 將成為 PRIMARY 節點，此時 MongoDB 還是依舊對外提供服務的。乘此時機，趕緊排查出故障的那臺服務器的原因，盡快恢復服務。

為了讓投票節點可以占用更少的資源，可以在配置文件中添加以下幾個配置項：

journal = false smallfiles = true noprealloc = true

主從復制

master-slave 復制架構已經不推薦使用了，建議使用 replica sets 復制集架構。

參見： http://docs.mongoing.com/manual-zh/core/master-slave.html

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1448113292072.html

MongoDB NoSQL數據庫