MongoDB PHP Driver的連接處理解析

cd33 9年前發布 | 22K 次閱讀 MongoDB NoSQL數據庫

1.3版本的PHP MongoDB driver重寫了連接處理庫,和以前版本相比,在持久連接和連接池方面,都有了重大的變化。

1.2版本的連接管理

1.2版本的驅動引入了連接池,在執行任何查詢時,都會從連接池中請求一個連接,完成之后再歸還給連接池。這里的完成是指持有該連接的變量離開了它的作用域,下面是一個示例。

最簡單的版本:

<?php
$m = new MongoClient();    // ← 從連接池請求連接
$c = $m->demo->test;
$c->insert( array( 'test' => 'yes' ) );
?>

← $m離開作用域,連接歸還給連接池

在函數中:

<?php
function doQuery()
{
        $m = new MongoClient();    // ← 從連接池請求連接
        $c = $m->demo->test;
        $c->insert( array( 'test' => 'yes' ) );
} // ← $m離開作用域,連接歸還給連接池
?>

在某些情況下,系統可能會產生大量的連接,比如在ORMs/ODMs的某個復雜結構中引用連接對象,如下例子:

<?php
for ( $i = 0; $i < 5; $i++ )
{
        $conns[] = new MongoClient();
}// ← 現在有5個連接
?>

1.3版本的連接管理

在1.3版本中,連接管理做了很大改動。每個worker進程(線程、PHP-FPM或Apache worker)中,驅動把連接管理和Mongo*對象分離,降低驅動的復雜度。下面以單個節點的MongoDB實例來說明驅動如何處理連接。

當一個worker進程啟動,MongoDB驅動會為之初始化連接管理器管理連接,并且默認沒有連接。

在第一個請求調用new MongoClient();時,驅動創建一個新連接,并且以一個哈希值標識這個連接。這個哈希值包括以下參數:主機名、端口,進程ID和可選的 replica set名,如果是密碼驗證的連接,則還包括數據庫名、用戶名和密碼的哈希值(對于密碼驗證的連接,我們后面再詳細討論)。調用 MongoClient::getConnections()方法,可以查看連接對應的哈希值:

<?php
$m = new MongoClient( 'mongodb://whisky:27017/' );
var_dump( $m->getConnections()[0]['hash'] );
?>

輸出:

string(22) “whisky:27017;-;X;22835″

輸出中的”-”表示該連接不屬于某個replica set,”X”是沒有用戶名、數據庫和密碼時的占位符,22835是當前進程的進程ID。

然后該連接會在連接管理器中注冊: MongoDB PHP Driver的連接處理解析

在需要連接的任何時候,包括插入、刪除、更新、查找或執行命令,驅動都會向管理器請求一個合適的連接來執行。請求連接時會用到new MongoClient()的參數和當前進程的ID。每個worker進程/線程,連接管理器都會有一個連接列表,而每個PHP worker同一時刻,只會運行一個請求,因此和每個MongoDB之間只需要一個連接,不斷重用,直到PHP worker終止或顯式調用MongoClient::close()關閉連接。

Replica sets

在存在復制集的環境中,情形有點不一樣。new MongoClient()的連接字符串中,需要指定多個hosts,并標示當前正在實用復制集:

$m = new MongoClient(“mongodb://whisky:13000,whisky:13001/?replicaSet=seta”);

其中的replicaSet參數不能省略,否則驅動會認為你是準備連接三個不同的mongos進程。

在實例化時,驅動會檢查復制集的拓撲結構。下面例子的輸出,顯示在調用new MongoClient()之后,復制集中所有可見的數據節點都會在管理器中注冊一個連接:

<?php
$m = new MongoClient( 'mongodb://whisky:13001/?replicaSet=seta' );
foreach ( $m->getConnections() as $c )
{
    echo $c['hash'], "\n";
}
?>

輸出:

whisky:13001;seta;X;32315 whisky:13000;seta;X;32315

雖然連接字符串中沒有whisky:13000節點,但是管理器中已經注冊了兩個連接:

MongoDB PHP Driver的連接處理解析

管理器不僅包含連接的哈希值和TCP/IP socket,還保存哪個節點是主節點,以及每個節點的“距離”。下面的腳本顯示了這些額外的信息;

<?php
$m = new MongoClient( 'mongodb://whisky:13001/?replicaSet=seta' );
foreach ( $m->getConnections() as $c )
{
    echo $c['hash'], ":\n",
        " - {$c['connection']['connection_type_desc']}, ",
        "{$c['connection']['ping_ms']} ms\n";
}
?>

輸出:

whisky:13001;seta;X;5776: – SECONDARY, 1 ms whisky:13000;seta;X;5776: – PRIMARY, 0 ms

驅動把操作分為兩種類型:寫操作,包括插入、更新、刪除和命令;讀操作,包括find和findOne。默認情況下,如果沒有設置讀偏好參數,管理器會一直返回主節點的連接。讀偏好參數可以通過setSlaveOkay()設置,也可以在連接字符串中設置:

$m = new MongoClient("mongodb://whisky:13000,whisky:13001/?replicaSet=seta&readPreference=secondaryPreferred");

加上這些參數后,連接字符串變得特別長,因此PHP驅動允許將選項放在數組中,作為第二個參數傳入:

$options = array(
        'replicaSet' => 'seta',
        'readPreference' => 'secondaryPreferred',
);
$m = new MongoClient("mongodb://whisky:13000,whisky:13001/", $options);

對于每個操作,驅動向管理器請求獲取一個合適的連接。對于寫操作,會一直返回主節點的連接;對于讀操作,如果輔助節點可用且“距離”不遠的話,則會返回該輔助節點的連接。

驗證的連接

如果MongoDB啟用驗證功能,那么連接的哈希值會包含驗證相關的哈希值。這樣不同腳本,使用不同的用戶名、密碼連接同一個MongoDB上的不 同的數據庫時,能夠相互區分,而不會誤用連接。下面示例使用admin用戶名連接admin數據庫,然后觀察hash值的變化:

<?php
$m = new MongoClient( 'mongodb://admin:admin@whisky:27017/admin' );
var_dump( $m->getConnections()[0]['hash'] );
?>

輸出:

string(64) “whisky:27017;-;admin/admin/bda5cc70cd5c23f7ffa1fda978ecbD30;8697″

以前示例中的”X”部分已經替換為一個包含數據庫名admin、用戶名admin和哈希值bda5cc70cd5c23f7ffa1fda978ecbd30,該哈希值是根據用戶名、數據庫名和密碼哈希值計算得來。

為了驗證能夠正確工作,需要在連接字符串中包含數據庫名,否則會默認為admin。

在建立連接后要使用數據庫,需要先選擇該數據庫,如:

$collection = $m->demoDb->collection; $collection->findOne();

如果選擇的數據庫是連接字符串中指定的數據庫,或者連接字符串中的數據庫是admin,那么一切都會正常運行。否則,驅動會創建一個新的連接,從而防止驗證被繞過,如下所示:

<?php
$m = new MongoClient( 'mongodb://user:user@whisky:27017/test' );

$db = $m->test2;
$collection = $db->collection;
var_dump( $collection->findOne() );
?>

輸出:

Fatal error: Uncaught exception ‘MongoCursorException’ with message ‘whisky:27017: unauthorized db:test2 ns:test2.collection lock type:0 client:127.0.0.1′ in …/mongo-connect-5.php.txt:6

因為我們的連接并沒有執行test2數據庫的授權驗證,因而失敗。如果我們執行驗證,就會正常運行:

<?php
$m = new MongoClient( 'mongodb://user:user@whisky:27017/test' );

$db = $m->test2;
$db->authenticate('user2', 'user2' );
$collection = $db->collection;
$collection->findOne();

foreach ( $m->getConnections() as $c )
{
    echo $c['hash'], "\n";
}
?>

輸出:

whisky:27017;-;test/user/602b672e2fdcda7b58a042aeeb034376;26983 whisky:27017;-;test2/user2/984b6b4fd6c33f49b73f026f8b47c0de;26983

現在管理器中有兩個已驗證的連接:

MongoDB PHP Driver的連接處理解析

順便提一句,如果你打開了E_DEPRECATED級別的錯誤提示,則會看到:

Deprecated: Function MongoDB::authenticate() is deprecated in …/mongo-connect-6.php.txt on line 5

驅動建議通過創建兩個MongoClient對象完成該類任務:

<?php
$mTest1 = new MongoClient( 'mongodb://user:user@whisky:27017/test', array( 'connect' => false ) );
$mTest2 = new MongoClient( 'mongodb://user2:user2@whisky:27017/test2', array( 'connect' => false ) );

$mTest1->test->test->findOne();
$mTest2->test2->test->findOne();

foreach ( $mTest2->getConnections() as $c )
{
    echo $c['hash'], "\n";
}
?>

單個MongoDB服務器能支持的并發連接相當有限,如果使用PHP-FPM的話,每個worker進程有自己獨立的連接池,那么很容易達到連接數 的上限。因此,在生產環境中,不管有沒有使用復制集,都要部署mongos,然后PHP-FPM連接mongos,這樣可以減少mongod的連接數,并 且PHP-FPM和mongos之間可以使用短連接(即每個請求結束時都顯式調用close函數關閉MongoDB連接)。

來源:風之緣的博客

 本文由用戶 cd33 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!