流水線即代碼

hbulq 7年前發布 | 8K 次閱讀 軟件開發

2016年11月份的技術雷達中給出了一個簡明的定義:流水線即代碼(Pipeline as Code)通過編碼而非配置持續集成/持續交付(CI/CD)運行工具的方式定義部署流水線。其實早在2015年11月份的技術雷達當中就已經有了類似的概念:

The way to avoid programming in your CI/CD tool is to extract the complexities of the build process from the guts of the tool and into a simple script which can be invoked by a single command. This script can then be executed on any developer workstation and therefore eliminates the privileged/singular status of the build environment.

大意是將復雜的構建流程納入一個簡單的腳本文件,然后用一條命令調用。這樣,任意的開發者都能在自己的工作區中執行腳本重建一套一模一樣的構建環境,從而消除CI/CD環境由于散亂配置腐化而成的特異性。

這么做的原因很好理解,使用CI/CD工具是為了暴露產品代碼中的問題,如果它們自身已經復雜到不穩定的地步,我們還使用它就是自找麻煩。

從某種程度上看,實施流水線即代碼是不證自明的。在CI/CD的實踐過程中,凡是可以被編碼的東西都已經被代碼化了,比如:構建、測試、數據庫遷移、部署和基礎設施/環境配置(Infrastruture as Code)等。說得爛俗點,流水線已經是CI/CD實踐過程中的“最后一公里”,讓流水線變成軟件開發中的“一等公民”(即代碼)是大勢所趨、民心所向。

不過,這種論斷畢竟欠缺說服力,我們接著從實踐的痛點出發總結當前流水線遇到的問題。

實踐中的痛點

我給客戶搭建和配置過不少CI/CD流水線(被同事戲謔地稱為“CI/CD搭建獸”),最大的痛苦莫過于每次都得從頭來過,即便大部分情況下所用的工具和配置都大同小異。

其次是手工操作產生的 配置漂移 (configuration drift)。以Jenkins為例,暫且不談1.0版本無法直接支持流水線這一問題,為了支持構建、測試和部署等,我們一般會先手工安裝所需插件,在多個文本框中粘貼大量shell/batch腳本,下載依賴包、設置環境變量等等。

久而久之(實際上用不了多久),這臺Jenkins服務器就變成無法替代(特異化)的“怪獸”了,因為沒人清楚到底對它做了哪些更改,也不知道這些更改對系統產生了哪些影響,這時的Jenkins服務器就腐化成了Martin Fowler口中的 雪花服務器 (snowflake server)。雪花服務器有兩點顯著的特征:

  • 特別難以復現
  • 幾乎無法理解

第一點是由于以往所做的更改并沒有被記錄下來,所以做過的操作都是七零八落的,沒有辦法復現同樣的操作,也無法復制一個同樣的系統。

第二點則是由于絕大部分情況下散亂的配置是沒有文檔描述的,哪部分重要、哪部分不重要已經無從知曉,改動的風險很大。

這些問題會在流水線的演化過程中惡化得越來越嚴重。

一般來講,除非不再使用,否則流水線不會保持一成不變。具體實施過程中,考慮到項目,尤其是遺留項目當前的特點和團隊成員的“產能”,我們會先將構建和部署自動化;部署節奏穩定后,開始將單元測試和代碼分析自動化;接著可以指導測試人員將驗收測試自動化;然后嘗試將發布自動化。

在這之后,并未結束,團隊還要持續優化流水線,包括CI的速度和穩定性等。換句話說,流水線的演化階段其實是和項目的當前進展密切相關的,保證這樣的對應關系有時是有必要的,比如:在多分支的版本控制下,發布分支所需流水線和主干分支會存在不同。發布分支是主干分支某個時刻分出去的,它需要在那時的流水線上才能正常工作。由于前面所說雪花服務器的特征,重建這樣一條流水線并不是一件容易的事情。

如何解決

其實,流水線即代碼本身已經回答了這個問題。當前實現這一概念的CI/CD工具大體遵循了兩種模式:

  • 版本控制
  • DSL(領域特定語言)

對于特別難以復現、沒有保證對應關系的痛點,我們就把流水線寫成代碼放到版本控制工具中管理起來。這樣一來,每一次更改都能被記錄下來,而且它會始終和此時的項目進展保持同步。

對于幾乎無法理解、沒有文檔支持的痛點,我們就選用領域特定語言描述整條流水線。舉個Jenkins2.0例子,它允許我們在項目的特定目錄下放置一個Jenkinsfile的文件,內容如下:

node('master') {
   stage('Checkout') {…}
   stage('Code Analysis') {…}
   stage('Unit Test') {…}
   stage('Packing') {…}
   stage('Archive') {…}
   stage('DEV') {…}
}
stage('SIT') {
   timeout(time:4, unit:'HOURS') {
       input "Deploy to SIT?"
   }
   node('master') {…}
}
stage('Acceptance Test') {
   node('slave') {…}
}

Jenkins2.0使用Groovy實現了一套描述流水線的DSL,我們即便不了解Groovy語言,只要對流水線稍微熟悉,就能按照 文檔中的例子 編寫出符合要求的代碼。

類似的工具還有 Concourse.ci 、 λCD (LambdaCD)等。 Concourse.ci使用了基于yaml的DSL,獨立抽象出Resource(外部依賴,如:git repo)、Job(函數,對Resource進行get或put操作)以及Task(純函數,必須明確定義Input/Output)模型。效果圖如下:

而λCD則使用Clojure語言實現了DSL,抽象出Pipeline和Step模型,使用了Lisp特有的宏(macro)擴展和自定義普通函數,編寫起來簡單明了。如下:

(def pipeline-def
 `(
   (either
    manualtrigger/wait-for-manual-trigger
    wait-for-repo)

   (with-workspace
     clone
     (in-parallel
      run-some-tests
      run-smokeing-tests)

     run-package
     deploy)))

上述的pipeline-def就是這條流水線的定義,極為優雅得是,它的代碼和UI事實上構成了——映射的關系,簡單到極致。

值得一提的是,λCD有別于其它同類型的工具,它本身就是一份用Clojure寫就的微服務。換句話說,其它的工具可能需要借助基礎設施即代碼完成自身的安裝,但λCD不用,它完全可以采用其它微服務的部署方式,比如用λCD部署它自己,類似于編譯器的自舉(bootstraping)。這個時候,我們就需要兩套λCD服務,一套用于部署λCD自身,另一套部署開發中的工程。

小結

流水線即代碼是個新概念,也就意味著我們還需要花時間去探索與之相關的實踐,比如,調試和測試(既然是代碼就需要測試)。一旦有了這些實踐,我們就可以把流水線本身作為產品放到流水線上運作起來,那時將會看到一種很好玩的現象——舊的流水線會構建并部署新流水線,發生上文所說自舉(bootstraping)現象,這也表明流水線是不斷進化的。

此外,當流水線成為代碼,它在最終的交付物中必然占據一席之地,其潛在的價值還等待我們挖掘,至少從精益的角度,流水線能做的事情還有很多。

更多精彩洞見,請關注微信公眾號:思特沃克

 

來自:http://insights.thoughtworkers.org/pipeline-as-code/

 

 本文由用戶 hbulq 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!