Python實現守護進程

zsl1017 7年前發布 | 13K 次閱讀 Python Python開發

考慮如下場景:你編寫了一個python服務程序,并且在命令行下啟動,而你的命令行會話又被終端所控制,python服務成了終端程序的一個子進程。因此如果你關閉了終端,這個命令行程序也會隨之關閉。

要使你的python服務不受終端影響而常駐系統,就需要將它變成守護進程。

守護進程就是Daemon程序,是一種在系統后臺執行的程序,它獨立于控制終端并且執行一些周期任務或觸發事件,通常被命名為"d"字母結尾,如常見的httpd、syslogd、systemd和dockerd等。

代碼實現

python可以很簡潔地實現守護進程,下面先給出代碼和相應注釋:

# coding=utf8
import os
import sys
import atexit


def daemonize(pid_file=None):
    """
    創建守護進程
    :param pid_file: 保存進程id的文件
    :return:
    """
    # 從父進程fork一個子進程出來
    pid = os.fork()
    # 子進程的pid一定為0,父進程大于0
    if pid:
        # 退出父進程,sys.exit()方法比os._exit()方法會多執行一些刷新緩沖工作
        sys.exit(0)

    # 子進程默認繼承父進程的工作目錄,最好是變更到根目錄,否則回影響文件系統的卸載
    os.chdir('/')
    # 子進程默認繼承父進程的umask(文件權限掩碼),重設為0(完全控制),以免影響程序讀寫文件
    os.umask(0)
    # 讓子進程成為新的會話組長和進程組長
    os.setsid()

    # 注意了,這里是第2次fork,也就是子進程的子進程,我們把它叫為孫子進程
    _pid = os.fork()
    if _pid:
        # 退出子進程
        sys.exit(0)

    # 此時,孫子進程已經是守護進程了,接下來重定向標準輸入、輸出、錯誤的描述符(是重定向而不是關閉, 這樣可以避免程序在 print 的時候出錯)

    # 刷新緩沖區先,小心使得萬年船
    sys.stdout.flush()
    sys.stderr.flush()

    # dup2函數原子化地關閉和復制文件描述符,重定向到/dev/nul,即丟棄所有輸入輸出
    with open('/dev/null') as read_null, open('/dev/null', 'w') as write_null:
        os.dup2(read_null.fileno(), sys.stdin.fileno())
        os.dup2(write_null.fileno(), sys.stdout.fileno())
        os.dup2(write_null.fileno(), sys.stderr.fileno())

    # 寫入pid文件
    if pid_file:
        with open(pid_file, 'w+') as f:
            f.write(str(os.getpid()))
        # 注冊退出函數,進程異常退出時移除pid文件
        atexit.register(os.remove, pid_file)

概括一下守護進程的編寫步驟:

  1. fork出子進程,退出父進程
  2. 子進程變更工作目錄(chdir)、文件權限掩碼(umask)、進程組和會話組(setsid)
  3. 子進程fork孫子進程,退出子進程
  4. 孫子進程刷新緩沖,重定向標準輸入/輸出/錯誤(一般到/dev/null,意即丟棄)
  5. (可選)pid寫入文件

理解幾個要點

為什么要fork兩次

第一次fork,是為了脫離終端控制的魔爪。父進程之所以退出,是因為終端敲擊鍵盤、或者關閉時給它發送了信號;而fork出來的子進程,在父進程自殺后成為孤兒進程,進而被操作系統的init進程接管,因此脫離終端控制。

所以其實,第二次fork并不是必須的(很多開源項目里的代碼就沒有fork兩次)。只不過出于謹慎考慮,防止進程再次打開一個控制終端。因為子進程現在是會話組長了(對話期的首次進程),有能力打開控制終端,再fork一次,孫子進程就不能打開控制終端了。

文件描述符

Linux是“一切皆文件”,文件描述符是內核為已打開的文件所創建的索引,通常是非負整數。進程通過文件描述符執行IO操作。

默認情況下,0代表標準輸入,1代表標準輸出,2代表標準錯誤。

umask權限掩碼

我們知道,在Linux中,任何一個文件都有讀(read)、寫(write)和執行(execute)的三種使用權限。其中,讀的權限用數字4代表,寫權限是2,執行權限是1。命令ls -l可以查看文件權限,r/w/x分別表示具有讀/寫/執行權限。

任何文件,也都有用戶(User),用戶組(Group),其他組(Others)三種身份權限。一般用3個數字表示文件權限,例如754:

  • 7,是User權限,即文件擁有者權限
  • 5,是Group權限,擁有者所在用戶組的組員所具有的權限
  • 4,是Others權限,即其他組用戶的權限啦

而umask是為了控制默認權限,防止新建文件或文件夾具有全權。

系統一般默認為022(使用命令umask查看),表示默認創建文件的權限是644,文件夾是755。你應該可以看出它們的規律,就是文件權限和umask的相加結果為666(笑),文件夾權限和umask的相加結果為777。

進程組

每個進程都屬于一個進程組(PG,Process Group),進程組可以包含多個進程。

進程組有一個進程組長(Leader),進程組長的ID(PID, Process ID)就作為整個進程組的ID(PGID,Process Groupd ID)。

會話組

登陸終端時,就會創造一個會話,多個進程組可以包含在一個會話中。而創建會話的進程,就是會話組長。

已經是會話組長的進程,不可以再調用setsid()方法創建會話。因此,上面代碼中,子進程可以調用setsid(),而父進程不能,因為它本身就是會話組長。

另外,sh(Bourne Shell)不支持會話機制,因為會話機制需要shell支持工作控制(Job Control)。

守護進程與后臺進程

通過&符號,可以把命令放到后臺執行。它與守護進程是不同的:

  1. 守護進程與終端無關,是被init進程收養的孤兒進程;而后臺進程的父進程是終端,仍然可以在終端打印
  2. 守護進程在關閉終端時依然堅挺;而后臺進程會隨用戶退出而停止,除非加上nohup
  3. 守護進程改變了會話、進程組、工作目錄和文件描述符,后臺進程直接繼承父進程(shell)的

換句話說:守護進程就是默默地奮斗打拼的有為青年,而后臺進程是默默繼承老爸資產的富二代。

 

來自:https://zhuanlan.zhihu.com/p/25118420

 

 本文由用戶 zsl1017 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!