基于PHP的一種Cache回調與自動觸發技術

1989r 10年前發布 | 18K 次閱讀 PHP Redis PHP開發
背景
在PHP中使用Memcache或者Redis時，我們一般都會對Memcache和Redis封裝一下，單獨完成寫一個Cache類，作為Memcache或者Redis的代理，且一般為單例模式。在業務代碼中，使用Cache類時，操作的基本的示例代碼如下
// cache 的 key
$key = 'this is key';
$expire = 60;// 超時時間
// cache 的實例
$cache = Wk_Cache::instance();
$data = $cache->fetch($key);
// 判斷data
if(empty($data)){
    // 如果為空，調用db方法
    $db = new Wk_DB();
    $data = $db->getXXX();
    $cache->store($key, $data, $expire);
}
// 處理$data相關數據
return $data;</pre> 
 
 
  基本流程為

第一步，先組裝查詢key，到Cache查詢Value，如果存在，繼續處理，進入第三步；如果不存在，進入第二步
第二步，根據請求，到DB中，查詢相關數據，如果數據存在，把數據放到Cache中
第三步，處理cache或者db中返回的數據
</div>
問題
上述流程基本上會出現在每次調用Cache的部分，先cache查詢，沒有的話調用DB或者第三方接口，獲取數據，再次存入Cache，繼續數據處理。單獨看這樣的代碼，邏輯合理，但是如果所有調用緩存的地方都是這樣的方式多就是一種問題了，應該把這種查詢方式封裝到更底層的方法內，而不是每次重復這樣的邏輯，除了封裝的問題外，還有其他一些問題，我們統一列舉下
 
  第一：從設計角度來說 重復代碼，需要更底層邏輯封裝。

  第二：key的組裝，麻煩繁瑣，實際情況，可能會把各種參數組裝進去，維護的時候，不敢輕易修改。

  第三：設置的expire超時時間，會分散在各處邏輯代碼中，最終很難統計Cache緩存時間的情況。

  第四：由于要把cache->store方法放到調用db之后執行，如果db后，還有其他邏輯處理，有可能會忘掉把數據放入cache，存在調試風險。

  第五：最重要的是高并發系統中，cache失效那一刻，會有大量請求直接穿透到后方，導致DB或者第三方接口壓力陡升，響應變慢，進一步影響系統穩定性，這一現象為“Dogpile”。

  以上問題中，最簡單的是2，3問題。對于expire超時時間分散的問題，我們可以通過統一配置文件來解決，比如我們可以創建這樣的一個配置文件。 

 
“test"=>array( // namespace，方便分組
             "keys"=> array(
                 “good”=>array(      // 定義的key，此key非最終入cache的key，入key需要和params組裝成唯一的key
                     "timeout"=>600, // 此處定義超時時間
                     "params"=>array("epid"=>1,"num"=>1),  // 通過這種方法，描述需要傳遞參數，用于組裝最終入cache的key
                     "desc"=>"描述"
                     ), 
                "top_test"=>array(   // 定義的key，此key非最終入cache的key，入key需要和params組裝成唯一的key
                     "timeout"=>60,  // 此處定義超時時間
                     "ttl"=>10,  // 自動觸發時間
                     "params"=>array('site_id'=>1,'boutique'=>1,'offset'=>1,'rows'=> 1,'uid'=>1,'tag_id'=>1,'type'=>1), // 通過這種方法，描述需要傳遞參數，用于組裝最終入cache的key
                     "desc"=>"描述",
                     "author"=>"ugg",
                     ),
）
）</pre> 
 
 如上所示，通過一個算法，我們可以把site_top_feeds和params組裝成唯一的入庫key，組裝后的key，大概是這樣 site_top_feeds_site_id=12&boutique=1&offset=0&rows=20&uid=&tag_id=0&type=2通過這種方式，我們避免工人自己組裝key，從而杜絕第二種問題，在這個配置文件中，我們也設置了timeout，這樣調用store時，我們可以直接從配置文件中讀取，從而避免第三個問題。經過如上修改后，我們的cache方法，也做了適當的調整，調用示例如下。 

$siteid = 121;
$seminal = 1;
$tag_id = 12;
$tag_id = 22;
$data =  fetch(‘site_top_feeds’,array('site_id'=>$siteid,'boutique'=>$seminal, 'offset'=>"0", 'rows' => "20", 'uid' =>null,’tag_id’=>$tag_id,’type'=>$type),'feed');
if(empty($data)){
// db相關操作
$db = new Wk_DB();
    $data = $db->getTopFeeds($site_id,$seminal,0,20,null,$tag_id,$type);
//  $data數據其他處理邏輯 這里
……
$cache->store(‘site_top_feeds’,$data,array(‘site_id'=>$siteid,'boutique'=>$seminal, 'offset'=>"0", 'rows' => "20", 'uid' =>null,’tag_id’=>$tag_id,’type'=>$type),'feed');
}</pre> 
 
通過以上方案，我們看到，timeout超時時間沒有了，key的組裝也沒有了，對于外層調用是透明的了。我們通過配置文件可以知道site_top_feeds的timeout是多少，通過封裝的算法，知道組裝的key是什么樣的。

這種方式，并沒有解決第一和第四的問題，封裝性；要想完成封裝性，第一件事情要做的就是回調函數，PHP作為腳本語言，并沒有完善的函數指針概念，當然要想執行一個函數其實也不需要指針。PHP支持回調函數的方法有兩種call_user_func，call_user_func_array。但是，經過測試會發現上述方法，執行效率比原生方法差很多  
native:0.0097959041595459s
call_user_func:0.028249025344849s
call_user_func_array:0.046605110168457s 
 例子代碼如下：

$s = microtime(true);
for($i=0; $i< 10000 ; ++$i){
    $a = new a();
    $data = $a->aaa($array, $array, $array);
    $data = a::bbb($array, $array, $array);
}
$e = microtime(true);
echo "native:".($e-$s)."s\n";
$s = microtime(true);
for($i=0; $i< 10000 ; ++$i){
    $a = new a();
    $data = call_user_func(array($a,'aaa'),$array,$array,$array);
    $data = call_user_func(array('a','bbb'),$array,$array,$array);
}
$e = microtime(true);
echo "call_user_func:".($e-$s)."s\n";
$s = microtime(true);
for($i=0; $i< 10000 ; ++$i){
    $a = new a();
    $data = call_user_func_array(array($a,'aaa'),array(&$array,&$array,&$array));
    $data = call_user_func_array(array('a','bbb'),array(&$array,&$array,&$array));
}
$e = microtime(true);
echo “call_user_func_array:".($e-$s)."s\n";</pre> 
 
在PHP中，知道一個對象和方法，其實調用方法很簡單，比如上面的例子

$a = new a();
$data = $a->aaa($array, $array, $array);
$obj = $a;
$func = ‘aaa’;
$params = array($array,$array,$array);
$obj->$func($params[0],$params[1],$params[2]);   // 通過這種方式可以直接執行 
 詳細代碼：

$s = microtime(true);
for($i=0; $i< 10000 ; ++$i){
    $obj = new a();
    $func = 'aaa';
    $params = array($array,$array,$array);
    $obj->$func($params[0],$params[1],$params[2]);  // 通過這種方式可以直接執行
}
$e = microtime(true);
echo "my_callback:".($e-$s)."s\n"; 
  這種方式的執行性能怎么樣，經過我們對比測試發現 

 

native:0.0092940330505371s
call_user_func:0.028635025024414s
call_user_func_array:0.048038959503174s
my_callback:0.011308288574219s 
 在加入大量方法策略驗證中，性能損耗比較低，時間消耗僅是原生方法的1.25倍左右，遠小于call_user_func的3倍多，call_user_func_array的5倍多，具體封裝后的代碼

switch(count($params)){
                case 0: $result = $obj->{$func}();break;
                case 1: $result = $obj->{$func}($params[0]);break;
                case 2: $result = $obj->{$func}($params[0],$params[1]);break;
                case 3: $result = $obj->{$func}($params[0],$params[1],$params[2]);break;
                case 4: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3]);break;
                case 5: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3],$params[4]);break;
                case 6: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3],$params[4],$params[5]);break;
                case 7: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3],$params[4],$params[5],$params[6]);break;
                default: $result = call_user_func_array(array($obj, $func), $params);  break;// 超過7項數據后變態方法，采用call_user_func_array機制，作為保底方案
            }    
 備注：在使用這種方法之前，考慮過使用create_function來創建匿名函數，執行函數回調，經過測試create_function只能創造全局函數，不能創建類函數和對象函數，遂放棄。

完成以上準備工作后，就可以使用回調機制了，再次調用的業務代碼
….
// 相關變量賦值
$db = new Wk_DB();
$callback['obj'] = $db;
            $callback['func'] = 'getTopFeeds';
            $callback['params'] = array('site_id'=>$siteid,'boutique'=>$seminal, 'offset'=>"0", 'rows' => "20", 'uid' =>null,'tag_id'=>$tag_id,'type'=>$type);

        $top_feed_list = $cache->smart_fetch('site_top_feeds',$callback,'feed');// smart_fetch第一步會先從cache取數據，如果cache無數據，會自動觸發$db->getTopFeeds($site_id...)方法的回調</pre> 

 
  使用以上方法實現對cache調用的封裝，同時保證性能的高效，從而解決第一和第四個問題。

  至此已經完成前四個問題，從而實現Cache的封裝，并有效的避免了上面提到的第二，第三，第四個問題。但是對于第五個問題，dogpile問題，并沒有解決，針對這種問題，最好的方式是在cache即將失效前，有一個進程主動觸發DB操作，獲取DB數據放入Cache中，而其他進程正常從Cache中獲取數據（因為此時Cache并未失效）；好在有Redis緩存可以選擇，我們可以使用Redis的兩個特性很好解決這個問題，先介紹下這兩個接口

  TTL方法：以秒為單位，返回給定 key 的剩余生存時間 (TTL, time to live)，當 key 不存在時，返回 -2 。當 key 存在但沒有設置剩余生存時間時，返回 -1 。否則，以秒為單位，返回 key 的剩余生存時間。很明顯，通過這個方法，我們很容易知道key的還剩下的生存時間，通過這個方法，可以在key過期前做點事情，但是光有這個方法還不行，我們需要確保只有一個進程執行，而不是所有的進程都做，正好用到下面這個方法。

  SETNX方法：將 key 的值設為 value ，當且僅當 key 不存在。若給定的 key 已經存在，則SETNX 不做任何動作。SETNX 是『SET if Not eXists』(如果不存在，則 SET) 的簡寫。返回值：設置成功，返回 1 。設置失敗，返回 0 。通過這個方法，模擬分布式加鎖，保證只有一個進程做執行，而其他的進程正常處理。結合以上Redis方法的特性，解決第五種的問題的，實例代碼。

 
…
// 變量初始化
$key = “this is key”;
$expiration = 600; 
$recalculate_at = 100;
$lock_length = 20;
$data = $cache->fetch($key); 
$ttl = $cache->redis->ttl($key); 
if($recalculate_at>=$ttl&&$r->setnx("lock:".$key,true)){ 
$r->expire(“lock:”.$key, $lock_length);
$db = new Wk_DB();
  $data = $db->getXXX();
  $cache->store($key, $expiration, $value);
} 
 解決方案

 
   好了，關鍵核心代碼如下
  1：function回調部分代碼 
 
public static function callback($callback){
        // 安全檢查
        if(!isset($callback['obj']) || !isset($callback['func'])
            || !isset($callback['params']) || !is_array($callback['params'])){
            throw new Exception("CallBack Array Error");
        }

        // 利用反射，判斷對象和函數是否存在
        $obj = $callback['obj'];
        $func = $callback['func'];
        $params = $callback['params'];
        // 方法判斷

        $method = new ReflectionMethod($obj,$func);
        if(!$method){
            throw new Exception("CallBack Obj Not Find func");
        }

    // 方法屬性判斷
    if (!($method->isPublic() || $method->isStatic())) {
        throw new Exception("CallBack Obj func Error");
    }   

    // 參數個數判斷(不進行逐項檢測)
    $paramsNum = $method->getNumberOfParameters();
    if($paramsNum < count($params)){
        throw new Exception("CallBack Obj Params Error");
    }   

    // 6個參數以內，逐個調用,超過6個，直接調用call_user_func_array
    $result = false;
    // 判斷靜態類方法
    if(!is_object($obj) && $method->isStatic()){
        switch(count($params)){
            case 0: $result = $obj::{$func}();break;
    case 1: $result = $obj::{$func}($params[0]);break;
            case 2: $result = $obj::{$func}($params[0],$params[1]);break;
            case 3: $result = $obj::{$func}($params[0],$params[1],$params[2]);break;
            case 4: $result = $obj::{$func}($params[0],$params[1],$params[2],$params[3]);break;
            case 5: $result = $obj::{$func}($params[0],$params[1],$params[2],$params[3],$params[4]);break;
            case 6: $result = $obj::{$func}($params[0],$params[1],$params[2],$params[3],$params[4],$params[5]);break;
            case 7: $result = $obj::{$func}($params[0],$params[1],$params[2],$params[3],$params[4],$params[5],$params[6]);break;
            default: $result = call_user_func_array(array($obj, $func), $params);  break;
        }
    }else{
        switch(count($params)){
            case 0: $result = $obj->{$func}();break;
            case 1: $result = $obj->{$func}($params[0]);break;
            case 2: $result = $obj->{$func}($params[0],$params[1]);break;
            case 3: $result = $obj->{$func}($params[0],$params[1],$params[2]);break;
            case 4: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3]);break;
            case 5: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3],$params[4]);break;
            case 6: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3],$params[4],$params[5]);break;
            case 7: $result = $obj->{$func}($params[0],$params[1],$params[2],$params[3],$params[4],$params[5],$params[6]);break;
            default: $result = call_user_func_array(array($obj, $func), $params);  break;
        }
    }</pre> 

2：自動觸發回調機制
public function smart_fetch($key,$callback,$namespace="wk") {
    key = $prefix.$key.$suffix;
        $result = $this->_redis->get($key);

    $bttl = false;
    // ttl狀態判斷(注意冷啟動)
    if(!empty($ttl)){
        // 獲得過期時間
        $rttl = $this->_redis->ttl($key);
        if($rttl > 0 && $ttl >= $rttl &&
            $this->_redis->setnx("lock".$key,true)){
            // 設置超時時間(超時時間3秒)
            $this->_redis->expire("lock".$key,3);
            $bttl = true;
        }
    }
// 如何返回值不存在，調用回調函數，獲取數值，并保持數據庫
    if($bttl || !$result || (isset($CONFIG['FLUSH']) && !empty($CONFIG['FLUSH']))){
        // 重新調整參數
        $callbackparams = array();
        foreach($params as $k=>$value){
            $callbackparams[] = $value;
        }
        $callback['params'] = $callbackparams;
        $result = Wk_Common::callback($callback);
        $expire = $key_config["timeout"];
        // 存儲數據
        $status = $this->_redis->setex($key, $expire, $result);
        $result=$this->_redis->get($key);
    }

    // 刪除鎖
    if($bttl){
        $this->_redis->delete("lock".$key);
    }
    return $result;
}</pre> 

至此，我們使用腳本語言特性，通過user_call_func_array方法補齊所有函數回調機制，從而實現對Cache的封裝，通過配置文件定義組裝key的規則和每個key的超時時間，再通過Redis的ttl和setnx特性，保證只有一個進程執行DB操作（setnx并非嚴格意義分布式鎖），從而很好避免dogpile問題，實現cache自動觸發，保證cache持續存在數據，并且有效減少DB的訪問次數，提高性能。
 聲明：云棲社區站內文章，未經作者本人允許或特別聲明，嚴禁轉載，但歡迎分享。 
 </div>
                    
                    
                         本文由用戶 1989r 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。
                         轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。
                         本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！
                         本文地址：http://www.baiduhome.net/lib/view/open1456217423870.html
                         PHP Redis PHP開發
基于PHP的一種Cache回調與自動觸發技術

相關經驗

相關資訊

相關文檔

目錄