Python實現守護進程

zsl1017 9年前發布 | 13K 次閱讀 Python Python開發

考慮如下場景：你編寫了一個python服務程序，并且在命令行下啟動，而你的命令行會話又被終端所控制，python服務成了終端程序的一個子進程。因此如果你關閉了終端，這個命令行程序也會隨之關閉。

要使你的python服務不受終端影響而常駐系統，就需要將它變成守護進程。

守護進程就是Daemon程序，是一種在系統后臺執行的程序，它獨立于控制終端并且執行一些周期任務或觸發事件，通常被命名為"d"字母結尾，如常見的httpd、syslogd、systemd和dockerd等。

代碼實現

python可以很簡潔地實現守護進程，下面先給出代碼和相應注釋：

# coding=utf8
import os
import sys
import atexit


def daemonize(pid_file=None):
    """
    創建守護進程
    :param pid_file: 保存進程id的文件
    :return:
    """
    # 從父進程fork一個子進程出來
    pid = os.fork()
    # 子進程的pid一定為0，父進程大于0
    if pid:
        # 退出父進程，sys.exit()方法比os._exit()方法會多執行一些刷新緩沖工作
        sys.exit(0)

    # 子進程默認繼承父進程的工作目錄，最好是變更到根目錄，否則回影響文件系統的卸載
    os.chdir('/')
    # 子進程默認繼承父進程的umask（文件權限掩碼），重設為0（完全控制），以免影響程序讀寫文件
    os.umask(0)
    # 讓子進程成為新的會話組長和進程組長
    os.setsid()

    # 注意了，這里是第2次fork，也就是子進程的子進程，我們把它叫為孫子進程
    _pid = os.fork()
    if _pid:
        # 退出子進程
        sys.exit(0)

    # 此時，孫子進程已經是守護進程了，接下來重定向標準輸入、輸出、錯誤的描述符(是重定向而不是關閉, 這樣可以避免程序在 print 的時候出錯)

    # 刷新緩沖區先，小心使得萬年船
    sys.stdout.flush()
    sys.stderr.flush()

    # dup2函數原子化地關閉和復制文件描述符，重定向到/dev/nul，即丟棄所有輸入輸出
    with open('/dev/null') as read_null, open('/dev/null', 'w') as write_null:
        os.dup2(read_null.fileno(), sys.stdin.fileno())
        os.dup2(write_null.fileno(), sys.stdout.fileno())
        os.dup2(write_null.fileno(), sys.stderr.fileno())

    # 寫入pid文件
    if pid_file:
        with open(pid_file, 'w+') as f:
            f.write(str(os.getpid()))
        # 注冊退出函數，進程異常退出時移除pid文件
        atexit.register(os.remove, pid_file)

概括一下守護進程的編寫步驟：

fork出子進程，退出父進程
子進程變更工作目錄(chdir)、文件權限掩碼(umask)、進程組和會話組(setsid)
子進程fork孫子進程，退出子進程
孫子進程刷新緩沖，重定向標準輸入／輸出／錯誤（一般到/dev/null，意即丟棄）
(可選)pid寫入文件

理解幾個要點

為什么要fork兩次

第一次fork，是為了脫離終端控制的魔爪。父進程之所以退出，是因為終端敲擊鍵盤、或者關閉時給它發送了信號；而fork出來的子進程，在父進程自殺后成為孤兒進程，進而被操作系統的init進程接管，因此脫離終端控制。

所以其實，第二次fork并不是必須的（很多開源項目里的代碼就沒有fork兩次）。只不過出于謹慎考慮，防止進程再次打開一個控制終端。因為子進程現在是會話組長了（對話期的首次進程），有能力打開控制終端，再fork一次，孫子進程就不能打開控制終端了。

文件描述符

Linux是“一切皆文件”，文件描述符是內核為已打開的文件所創建的索引，通常是非負整數。進程通過文件描述符執行IO操作。

默認情況下，0代表標準輸入，1代表標準輸出，2代表標準錯誤。

umask權限掩碼

我們知道，在Linux中，任何一個文件都有讀（read）、寫（write）和執行（execute）的三種使用權限。其中，讀的權限用數字4代表，寫權限是2，執行權限是1。命令ls -l可以查看文件權限，r/w/x分別表示具有讀/寫/執行權限。

任何文件，也都有用戶（User）,用戶組（Group）,其他組（Others）三種身份權限。一般用3個數字表示文件權限，例如754：

7，是User權限，即文件擁有者權限
5，是Group權限，擁有者所在用戶組的組員所具有的權限
4，是Others權限，即其他組用戶的權限啦

而umask是為了控制默認權限，防止新建文件或文件夾具有全權。

系統一般默認為022（使用命令umask查看），表示默認創建文件的權限是644，文件夾是755。你應該可以看出它們的規律，就是文件權限和umask的相加結果為666（笑），文件夾權限和umask的相加結果為777。

進程組

每個進程都屬于一個進程組（PG,Process Group），進程組可以包含多個進程。

進程組有一個進程組長（Leader），進程組長的ID（PID, Process ID）就作為整個進程組的ID（PGID,Process Groupd ID）。

會話組

登陸終端時，就會創造一個會話，多個進程組可以包含在一個會話中。而創建會話的進程，就是會話組長。

已經是會話組長的進程，不可以再調用setsid()方法創建會話。因此，上面代碼中，子進程可以調用setsid()，而父進程不能，因為它本身就是會話組長。

另外，sh（Bourne Shell）不支持會話機制，因為會話機制需要shell支持工作控制（Job Control）。

守護進程與后臺進程

通過&符號，可以把命令放到后臺執行。它與守護進程是不同的：

守護進程與終端無關，是被init進程收養的孤兒進程；而后臺進程的父進程是終端，仍然可以在終端打印
守護進程在關閉終端時依然堅挺；而后臺進程會隨用戶退出而停止，除非加上nohup
守護進程改變了會話、進程組、工作目錄和文件描述符，后臺進程直接繼承父進程（shell）的

換句話說：守護進程就是默默地奮斗打拼的有為青年，而后臺進程是默默繼承老爸資產的富二代。

來自：https://zhuanlan.zhihu.com/p/25118420

本文由用戶 zsl1017 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1486556223323.html

Python Python開發

Python實現守護進程

代碼實現

理解幾個要點

相關經驗

相關資訊

相關文檔

目錄