前端模板的原理與實現

yeafing 9年前發布 | 15K 次閱讀 JSP HTML 前端技術 JavaScript

時下流行什么react, avalon, angular, vue什么，其核心都離不開前端模板。理解前端模板，是我們了解MV* 的關鍵。

前端框架最重要的目的是將頁面渲染出來。“渲染”(render)這個詞最初不是前端的東西的。前端之前叫做切圖，將設計師做的PSD變成一個靜態頁面，然后加上動態交互。但是我們有許多數據是來自后端，如何將數據加入靜態頁面呢?于是又多了一套工序叫“套頁面”。套頁面的過程實際就是將靜態頁面變成切割成一塊塊，每一塊都是一個php，jsp或vm文件，它們是后端模板引擎的處理對象!

其實模板是不局限于后端還是前端的，模板的本質是用于從數據(變量)到實際的視覺表現(HTML代碼)這項工作的一種實現手段。由于后端近水樓臺先得月(取數據比較方便)，因此先在后端發展出這種技術。這些后端模板文件是活動于服務器的，然后經過復雜的處理，最后由瀏覽器渲染出來。這時的渲染是將服務器拼接好的靜態文本變成一個DOM樹的過程。

如果要實現前端實現MVC或MVP，那些工序必須發生改變。靜態文件產出是不變，尤其是大公司，分工夠細，有專門的切圖組(大多數是妹子)將它們做出來。接著是套頁面，這時就不能使用后端模板引擎，需要引入前端模板引擎。由于實現一個前端模板引擎太簡單了，經過多年的發展，已經有眾多好用的輪子：

https://github.com/janl/musta...

基于JavaScript的Logic-less(無邏輯或輕邏輯)模板。

https://github.com/推ter/ho...

上面的優化版，推ter出品

https://github.com/wycats/han...

完全兼容mustcache的語法

https://github.com/paularmstr...

擁有更強悍的模板繼承與block 重寫功能

https://github.com/mozilla/nu...

跟django的模板系統相似，可以說swig的升級版，是gitbook的御用前端模板

其它推薦的還有ejs，易學易用，對有過ASP/PHP/JSP編程經驗的人來說，非常親切自然，缺點就是功能有點簡單。

其他doT, xtempalate， Underscore Templates。

最不推薦是jade，有點華而不實，過度設計，導致套頁面工作量大，性能其差。

虛擬DOM時代流行的jsx就是無邏輯模板。之所以流行無邏輯或輕邏輯模板，其主要原因是改動成本比較少，像jade這樣自造語法糖太多，從美工手中拿來的html需要大動干戈，進行摧心折骨般的改造才能套數據。對于模板來說，最簡單而言，就是將某個可變數據放到適當的地方(填空)，而其次，可以控制這個區域輸出不輸入(if指令)，或讓其個區域循環輸入多次(for指令)，更強制，實現模板互相套嵌(layout與block)。為了實現if與for有兩種方法，一種是單純的區域，插入一個js 語句，里面有if語句與for語句，另一種是使用語法糖，比如說 ms-for, ms-repeat, ng-if, ng-repeat。語法糖的用法比直接使用JS語句簡單，但是帶來學習成本與拓展功能。每一個模板 if, for指令的語法都不一樣的，并且你想在循環做一些處理，比如過濾一些數據，或突然在某處中斷，這又得引用一些新的語句。隨著模板要求前后共用，就有了傳輸成本，直接寫JS語句在模板里面肯定比不過語法糖。因此基于這種種原因，mustache風格的模板就成為主流。

現在三種模板風格：

PHP/ASP/JSP風格：

<% if ( list.length ) { %> 
  <ol> 
    <% for ( n=0; n<list.length; ++n ) { %> 
      <li> 
        <%= list[n] %> 
      </li> 
    <% } %> 
  </ol> 
<% } %>

mustcache風格，高級語法有限，通常難自定義拓展：

{{#if list.length}} 
  <ol> 
    {{#each list item}} 
      <li> 
        {{ item }} 
      </li> 
    {{/each}} 
  </ol> 
{{/if}}

屬性綁定風格：

<ol ms-if="list.length"> 
  <li ms-for="item in list"> 
      {{item}} 
  </li> 
</ol>

前兩者只能出現于script, textarea等容器元素內部。因此<分隔符與標簽的<容器造成沖突，并且也不利于IDE的格式化處理。屬性綁定風格則是MVVM時期最流行的模板定義風格，某頁面某個區域就是一個模板，不需要進行入append等操作。

我們再來看如何實現前端模板。前端模板的本質就是一個可以轉換函數(渲染函數)的字符串。渲染函數放進一個充滿數據的對象后，還原為一個全新的字符串。因此重點是如何構建一個渲染函數。最簡單的方式是正則，還記得第二章的format方法嗎，這就是一個輕型的填充數據的方法。

function format(str, object) { 
    var array = Array.prototype.slice.call(arguments, 1); 
    return str.replace(/\\?\#{([^{}]+)\}/gm, function(match, name) { 
        if (match.charAt(0) == '\\') 
            return match.slice(1); 
        var index = Number(name) 
        if (index >= 0) 
            return array[index]; 
        if (object && object[name] !== void 0) 
            return  object[name]; 
        return  ''; 
    }); 
}

format方法是通過#{ }來劃分靜態內容與動態內容的，一般來說它們稱之為定界符(delimiter)。#{為前定界符，}為后界符，這個#{}其實是ruby風格的定界符。通常的定界符是<%與%>，{{與}} 。通常在前定界符中還有一些修飾符號，比如=號，表示這個會輸出到頁面，-號，表示會去掉兩旁的空白。

將下例，要編譯成一個渲染函數

var tpl = '你好,我的名字啊<%name%>, 今年已經 <%info.age%>歲了' 
 var data = { 
     name: "司徒正美", 
     age: 20 
 }

大抵是這樣

var body = '你好,我的名字叫'+ data.name+ ', 今年已經 '+data.info.age+ '歲了' 
var render = new Function('data', 'return '+ body)

或者聰明一點，使用數組來join:

var array = ['return '] 
array.push('你好,我的名字叫'） 
array.push(data.name) 
array.push(', 今年已經') 
array.push(data.info.age) 
array.push( '歲了') 
var render = new Function('data', array.join('+'))

這就得區分靜態內容與為變量前加data.前綴。這一步可以用正則來做，也可以用純字符串。我們試一下純字符串方式。假令前定界符為openTag，后定界符為closeTag，通過indexOf 與slice方法，就可以將它切成一塊塊。

function tokenize(str) { 
    var openTag = '<%' 
    var closeTag = '%>' 
    var ret = [] 
    do { 
        var index = str.indexOf(openTag) 
        index = index === -1 ? str.length : index 
        var value = str.slice(0, index) 
        //抽取{{前面的靜態內容 
        ret.push({ 
            expr: value, 
            type: 'text' 
        }) 
        //改變str字符串自身 
        str = str.slice(index + openTag.length) 
        if (str) { 
            index = str.indexOf(closeTag) 
            var value = str.slice(0, index) 
            //抽取{{與}}的動態內容 
            ret.push({ 
                expr: value.trim(),//JS邏輯兩旁的空白可以省去 
                type: 'js' 
            }) 
            //改變str字符串自身 
            str = str.slice(index + closeTag.length) 
        } 
    } while (str.length) 
    return ret 
} 
console.log(tokenize(tpl))

然后通過render方法將它們拼接起來。

function render(str) { 
     var tokens = tokenize(str) 
     var ret = [] 
     for (var i = 0, token; token = tokens[i++]; ) { 
         if (token.type === 'text') { 
             ret.push('"' + token.expr + '"') 
         } else { 
             ret.push(token.expr) 
         } 
     } 
     console.log("return "+ ret.join('+')) 
 }

打印出來如下

return "你好,我的名字叫"+name+", 今年已經 "+info.age+"歲了"

這個方法還不完整。首先光是在兩旁加上雙引號是不可靠的，萬一里面還有雙引號怎么辦。因此我們需要引入第二章介紹的quote方法，當類型為文本時，ret.push(+quote(token.expr)+)。其次需要對動態部分的變量加上.data。怎么知道它是一個變量呢。我們回想一下變量的定義，就是以_,$或字母開頭的字符組合。為了簡潔起見，我們暫時不用里會中文的情況。不過，info.age這個字符串里面，其實有兩個符合變量的子串，而我只需要在info前面加data.。這時，我們需要設法在匹配變量前，將對象的子級屬性替換掉，替換成不符合變量的字符，然后再替換為去。為此，我搞了一個dig與fill方法，將子級屬性變成??12這樣的字符串:

return "你好,我的名字叫"+name+", 今年已經 "+info.age+"歲了"

輸出為

return "你好,我的名字叫"+data.name+", 今年已經 "+data.info.age+"歲了"

最后，我們修改一下后面兩行，得到我們夢魅以求的渲染函數，它的實現過程比format方法復雜多了，但卻是所有擴展性極強的前端模板的一般實現過程。

function render(str){ 
  //略。。。 
     return new Function("data", "return " + ret.join('+')) 
  } 
  var fn = render(tpl) 
  console.log(fn+"") 
  console.log(fn(data))

我們再看一下如何引入循環語句，比如將上面的模板與數據改成這樣

var tpl = '你好,我的名字叫<%name%>, 今年已經 <%info.age%>歲了,喜歡<% for(var i = 0, el; el = list[i++];){%><% el %> <% } %>' 
 var data = { 
     name: "司徒正美", 
     info: { 
         age: 20 
     }, 
     list: ["蘋果","香蕉","雪梨"] 
 }

這時我們就添加一種新的類型，不輸出到頁面的動態內容。這在token方法中做一些修改

value = value.trim() 
if (/^(if|for|})/.test(value)) { 
    ret.push({ 
        expr: value, 
        type: 'logic' 
    }) 
} else { 
    ret.push({ 
        expr: value, 
        type: 'js' 
    }) 
}

但render方法怎么修改好呢，顯示這時繼續用+已經不行了，否則下場是這樣

return "你好,我的名字叫"+data.name+", 今年已經 "+data.info.age+"歲了,喜歡"+for(var i = 0, el; el = list[i++];){+""+data.el+" "+}

這時，我們需要借用數組，將要輸入的數據(text, js類型 )放進去，logic類型不放進去。

function addPrefix(str) { 
   // 先去掉對象的子級屬性,減少干擾因素 
   var js = str.replace(rproperty, dig) 
   js = js.replace(rident, function (a) { 
       return 'data.' + a 
   }) 
   return js.replace(rfill, fill) 
} 
function addView(s) { 
   return '__data__.push(' + s + ')' 
} 
function render(str) { 
    stringPool = {} 
    var tokens = tokenize(str) 
    var ret = ['var __data__ = []'] 
    tokens.forEach(function(token){ 
       if (token.type === 'text') { 
           ret.push(addView(quote(token.expr))) 
       } else if (token.type === 'logic') { 
           //邏輯部分都經過addPrefix方法處理 
           ret.push(addPrefix(token.expr)) 
       } else { 
           ret.push(addView(addPrefix(token.expr))) 
       } 
    }) 
    ret.push("return __data__.join('')") 
    console.log( ret.join('\n')) 
  } 
var fn = render(tpl)

得到的內部結構是這樣的，顯然addPrefix方法出問題，我們應該過濾掉if, for等關鍵字與保留字。

var __data__ = [] 
__data__.push("你好,我的名字叫") 
__data__.push(data.name) 
__data__.push(", 今年已經 ") 
__data__.push(data.info.age) 
__data__.push("歲了,喜歡") 
data.for(data.var data.i = 0, data.el; data.el = data.list[data.i++]){ 
__data__.push("") 
__data__.push(data.el) 
__data__.push(" ") 
} 
return __data__.join('')

但即使我們處理掉關鍵字與保留字，對于中間生成i, el怎么區分呢?是區分不了。于是目前有兩種方法，一是使用with，這時我們就不需要加data.前綴。第二種引入新的語法。比如，前面是@就替換為data.。

先看第一種：

function render(str) { 
     stringPool = {} 
     var tokens = tokenize(str) 
     var ret = ['var __data__ = [];', 'with(data){'] 
     for (var i = 0, token; token = tokens[i++]; ) { 
         if (token.type === 'text') { 
             ret.push(addView(quote(token.expr))) 
         } else if (token.type === 'logic') { 
             ret.push(token.expr) 
         } else { 
             ret.push(addView(token.expr)) 
         } 
     } 
     ret.push('}') 
     ret.push('return __data__.join("")') 
     return new Function("data", ret.join('\n')) 
 } 
 var fn = render(tpl) 
 console.log(fn + "") 
 console.log(fn(data))

許多迷你模板都是用with減少替換工作。

第二種方法，使用引導符@, avalon2就是這么玩。這樣addPrefix方法可以減少許多代碼。相對應，模板也要改動一下

var tpl = '你好,我的名字叫<%@name%>, 今年已經 <%@info.age%>歲了,喜歡<% for(var i = 0, el; el = @list[i++];){%><% el %> <% } %>' 
var rguide = /(^|[^\w\u00c0-\uFFFF_])(@|##)(?=[$\w])/g 
function addPrefix(str) { 
    return str.replace(rguide, '$1data.') 
} 
function render(str) { 
    stringPool = {} 
    var tokens = tokenize(str) 
    var ret = ['var __data__ = [];'] 
    for (var i = 0, token; token = tokens[i++]; ) { 
        if (token.type === 'text') { 
            ret.push(addView(quote(token.expr))) 
        } else if (token.type === 'logic') { 
            //邏輯部分都經過addPrefix方法處理 
            ret.push(addPrefix(token.expr)) 
        } else { 
            ret.push(addView(addPrefix(token.expr))) 
        } 
    } 
    
    ret.push('return __data__.join("")') 
    return new Function("data", ret.join('\n')) 
} 
var fn = render(tpl) 
console.log(fn + "") 
console.log(fn(data))

第二種比第一種的優勢在于，性能更高，并且避開es5嚴格模式的限制。

我們再認真思考一下，其實循環語句與條件語句，不單是for, if兩個，還有while, do while, else什么。因此這需要優化。這也有兩種方法，添加更多語法符合，比如上面所說的=就是輸出，沒有則不輸出。這是ASP/JSP/PHP等模板采用的手段：

//tokenize方法 
if (value.charAt(0) === '=') { 
     ret.push({ 
         expr: value,  
         type: 'js' 
     }) 
 } else { 
     ret.push({ 
         expr: value,  
         type: 'logic' 
     }) 
 }

另一種，使用語法糖，如#each (el, index) in @list , '#eachEnd', '#if ','#ifEnd'。還是改動tokenize方法

if (value.charAt(0) === '#') { 
    if (value === '#eachEnd' || value === '#ifEnd') { 
        ret.push({ 
            expr: '}', 
            type: 'logic' 
        }) 
    } else if (value.slice(0, 4) === '#if ') { 
        ret.push({ 
            expr: 'if(' + value.slice(4) + '){', 
            type: 'logic' 
        }) 
    } else if (value.slice(0, 6) === '#each ') { 
        var arr = value.slice(6).split(' in ') 
        var arrayName = arr[1] 
        var args = arr[0].match(/[$\w_]+/g) 
        var itemName = args.pop() 
        var indexName = args.pop() || '$index' 
        value = ['for(var ', ' = 0;', '<' + arrayName + '.length;', '++){'].join(indexName) + 
                '\nvar ' + itemName + ' = ' + arrayName + '[' + indexName + '];' 
        ret.push({ 
            expr: value, 
            type: 'logic' 
        }) 
     
    } 
     
} else{ 
   //... 
}

對應的模板改成

var tpl = '你好,我的名字叫<%@name%>, 今年已經 <%@info.age%>歲了,喜歡<%#each el in @list %><% el %> <% #eachEnd %>' 
var fn = render(tpl) 
console.log(fn + "") 
console.log(fn(data))

可能有人覺#for, #forEnd這樣的語法糖比較丑，無問題，這個可以改，主要我們的tokenize方法足夠強大，就能實現mustache這樣的模板引擎。但所有模板引擎也基本上是這么實現的，有的還支持過濾器，也就是在js 類型的語句再進行處理，將|后面的字符器再切割出來。

如果虛擬DOM呢?那就需要一個html parser，這個工程巨大，比如reactive這個庫，早期不使用html parser與虛擬DOM，只有3，4千行，加入這些炫酷功能后就達到1W6K行。返回一個字符串與返回一個類似DOM樹的對象樹結構是不一樣。

來自：http://developer.51cto.com/art/201609/518210.htm

本文由用戶 yeafing 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1475139770746.html

JSP HTML 前端技術 JavaScript

前端模板的原理與實現

相關經驗

相關資訊

相關文檔

目錄