Generator 函數的含義與用法

8gw234 9年前發布 | 16K 次閱讀 JavaScript開發 ECMAScript 6

作者: 阮一峰

日期: 2015年4月24日

本文是《深入掌握 ECMAScript 6 異步編程》系列文章的第一篇。

  • 《Generator 函數的含義與用法》
  • 《Thunk 函數的含義與用法》
  • 《Co 函數庫的含義與用法》
  • 《Async 函數的含義與用法》

異步編程對 JavaScript 語言太重要。JavaScript 只有一根線程,如果沒有異步編程,根本沒法用,非卡死不可。

以前,異步編程的方法,大概有下面四種。

  • 回調函數
  • 事件監聽
  • 發布/訂閱
  • Promise 對象

ECMAScript 6 (簡稱 ES6 )作為下一代 JavaScript 語言,將 JavaScript 異步編程帶入了一個全新的階段。 這組系列文章的主題,就是介紹更強大、更完善的 ES6 異步編程方法。

新方法比較抽象,初學時,我常常感到費解,直到很久以后才想通, 異步編程的語法目標,就是怎樣讓它更像同步編程? 這組系列文章,將幫助你深入理解 JavaScript 異步編程的本質。此外,所有下面將要講到的內容,都已經實現了。也就是說,馬上就能用,套用一句廣告語,就是"未來已來"。

一、什么是異步?

所謂"異步",簡單說就是一個任務分成兩段,先執行第一段,然后轉而執行其他任務,等做好了準備,再回過頭執行第二段。比如,有一個任務是讀取文件進行處理,異步的執行過程就是下面這樣。

上圖中,任務的第一段是向操作系統發出請求,要求讀取文件。然后,程序執行其他任務,等到操作系統返回文件,再接著執行任務的第二段(處理文件)。

這種不連續的執行,就叫做異步。相應地,連續的執行,就叫做同步。

上圖就是同步的執行方式。由于是連續執行,不能插入其他任務,所以操作系統從硬盤讀取文件的這段時間,程序只能干等著。

二、回調函數的概念

JavaScript 語言對異步編程的實現,就是回調函數。 所謂回調函數,就是把任務的第二段單獨寫在一個函數里面,等到重新執行這個任務的時候,就直接調用這個函數。 它的英語名字 callback,直譯過來就是"重新調用"。

讀取文件進行處理,是這樣寫的。

fs.readFile('/etc/passwd', function (err, data) {
  if (err) throw err;
  console.log(data);
});

上面代碼中,readFile 函數的第二個參數,就是回調函數,也就是任務的第二段。等到操作系統返回了 /etc/passwd 這個文件以后,回調函數才會執行。

一個有趣的問題是,為什么 Node.js 約定,回調函數的第一個參數,必須是錯誤對象err(如果沒有錯誤,該參數就是 null)?原因是執行分成兩段,在這兩段之間拋出的錯誤,程序無法捕捉,只能當作參數,傳入第二段。

三、Promise

回調函數本身并沒有問題,它的問題出現在多個回調函數嵌套。假定讀取A文件之后,再讀取B文件,代碼如下。

fs.readFile(fileA, function (err, data) {
  fs.readFile(fileB, function (err, data) {
    // ...
  });
});

不難想象,如果依次讀取多個文件,就會出現多重嵌套。代碼不是縱向發展,而是橫向發展,很快就會亂成一團,無法管理。這種情況就稱為 "回調函數噩夢" (callback hell)。

Promise就是為了解決這個問題而提出的。它不是新的語法功能,而是一種新的寫法,允許將回調函數的橫向加載,改成縱向加載。采用Promise,連續讀取多個文件,寫法如下。

var readFile = require('fs-readfile-promise');

readFile(fileA)
.then(function(data){
  console.log(data.toString());
})
.then(function(){
  return readFile(fileB);
})
.then(function(data){
  console.log(data.toString());
})
.catch(function(err) {
  console.log(err);
});

上面代碼中,我使用了 fs-readfile-promise 模塊,它的作用就是返回一個 Promise 版本的 readFile 函數。Promise 允許使用 then 方法加載回調函數,catch方法捕捉執行過程中拋出的錯誤。

可以看到,Promise 的寫法只是回調函數的改進,使用then方法以后,異步任務的兩段執行看得更清楚了,除此以外,并無新意。它的最大問題是代碼冗余,原來的任務被Promise 包裝了一下,不管什么操作,一眼看去都是一堆 then,原來的語義變得很不清楚。

那么,有沒有更好的寫法呢?

四、協程

傳統的編程語言,早有異步編程的解決方案(其實是多任務的解決方案)。其中有一種叫做 "協程" (coroutine),意思是多個線程互相協作,完成異步任務。

它的流程大致如下。

第一步,線程A開始執行。

第二步,線程A執行到一半,進入暫停,執行權轉移到線程B。

第三步,(一段時間后,)線程B交還執行權。

第四步,線程A恢復執行。

上面流程的線程A,就是異步任務,因為它分成兩段(或多段)執行。

舉例來說,讀取文件的協程寫法如下。

function asnycJob() {
  // ...其他代碼
  var f = yield readFile(fileA);
  // ...其他代碼
}

上面代碼的函數 asyncJob 是一個單獨的線程,它的奧妙就在其中的 yield 命令。它表示執行到此處,執行權將交給其他線程。也就是說,yield命令是異步兩個階段的分界線。

協程遇到 yield 命令就暫停,等到執行權返回,再從暫停的地方繼續往后執行。它的最大優點,就是代碼的寫法非常像同步操作,如果去除yield命令,簡直一模一樣。

五、Generator函數的概念

Generator 函數是協程在 ES6 的實現。由于 JavaScript 沒有多線程,所以 Generator 函數交出的是函數的(而不是交出線程的)執行權。

function* gen(x){
  var y = yield x + 2;
  return y;
}

上面代碼就是一個 Generator 函數。它不同于普通函數,是可以暫停執行的,所以函數名之前要加星號,以示區別。

整個 Generator 函數就是一個封裝的異步任務,或者說是異步任務的容器。異步操作需要暫停的地方,都用 yield 語句注明。Generator 函數的執行方法如下。

var g = gen(1);
g.next() // { value: 3, done: false }
g.next() // { value: undefined, done: true }

上面代碼中,調用 Generator 函數,會返回一個遍歷器對象 g 。這是 Generator 函數不同于普通函數的另一個地方,即執行它不會返回結果,返回的是指針對象。調用遍歷器對象 g 的 next 方法,會執行異步任務的第一段,直到遇到 yield 語句為止,上例是直到 x + 2 為止。

所以,next 方法的作用是分階段執行 Generator 函數。它的返回結果是一個對象,該對象的 value 屬性是 yield 語句后面表達式的值,done 屬性表示 Generator 函數是否執行完畢。也就是說,next 方法返回兩方面的信息:異步任務當前階段的返回值,以及是否還有下一個階段。

六、Generator 函數的數據交換和錯誤處理

Generator 函數可以暫停執行和恢復執行,這是它能封裝異步任務的根本原因。除此之外,它還有兩個特性,使它可以作為異步編程的完整解決方案:函數體內外的數據交換和錯誤處理機制。

next 方法的返回值( value 屬性),是 Generator 函數向外輸出數據;next 方法還可以接受參數,這是向Generator 函數體內輸入數據。

function* gen(x){
  var y = yield x + 2;
  return y;
}

var g = gen(1);
g.next() // { value: 3, done: false }
g.next(2) // { value: 2, done: true }

上面代碼中,最后一行的 next 方法帶有參數2,這個參數可以傳入 Generator 函數,作為上個階段異步任務的返回結果,被函數體內的變量 y 接收。所以,返回對象的 value 屬性,就變成了2。

Generator 函數內部還可以部署錯誤處理代碼,捕獲函數體外拋出的錯誤。

function* gen(x){
  try {
    var y = yield x + 2;
  } catch (e){ 
    console.log(e);
  }
  return y;
}

var g = gen(1);
g.next();
g.throw('出錯了');
// 出錯了

上面代碼的最后一行,Generator 函數體外,使用遍歷器對象的 throw 方法拋出的錯誤,可以被函數體內的 try ... catch 代碼塊捕獲。這意味著,出錯的代碼與處理錯誤的代碼,實現了時間和空間上的分離,這對于異步編程無疑是很重要的。

七、Generator函數的用法

下面看看如何使用 Generator 函數,執行一個真實的異步任務。

var fetch = require('node-fetch');

function* gen(){
  var url = 'https://api.github.com/users/github';
  var result = yield fetch(url);
  console.log(result.bio);
}

上面代碼中,Generator 函數封裝了一個異步操作,該操作先讀取一個遠程接口,然后從 JSON 格式的數據解析信息。就像前面說過的,這段代碼非常像同步操作,除了加上了 yield 命令。

執行這段代碼的方法如下。

var g = gen();
var result = g.next();

result.value.then(function(data){
  return data.json();
}).then(function(data){
  g.next(data);
});

上面代碼中,首先執行 Generator 函數,獲取遍歷器對象,然后使用 next 方法(第二行),執行異步任務的第一階段。由于 Fetch 模塊 返回的是一個 Promise 對象,因此要用 then 方法調用下一個next 方法。

可以看到,雖然 Generator 函數可以將異步操作表示得很簡潔,但是流程管理卻不方便(即何時執行第一階段、何時執行第二階段)。本系列的后面部分,就將介紹如何自動化異步任務的流程 管理。另外,本文對 Generator 函數的介紹很簡單,詳盡的教程請閱讀我寫的《ECMAScript 6入門》。

(完)


 本文由用戶 8gw234 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!