Python實現線程池

quguiliang 13年前發布 | 10K 次閱讀

最近在做一些文本處理方面的事情,考慮到程序利用并發性可以提高執行效率(不糾結特殊反例),于是入圍的Idea如使用多進程或多線程達到期望的目標,對于進程或線程的創建是有代價的,那么我們是否可以實現一個線程池來達到已創建的線程反復使用從而使代價降低到最小呢?
當然可以,要想創建一個線程池,那么必須得有個容器來模擬“池”,在Python中,隊列這樣的數據結構就可以幫我們解決“池”這個問題,然而隨之引來的多線程之間數據處理同步問題,好在Python中有個Queue模塊幫我們解決了這一棘手的問題,那么我們就可以實現一個線程池的雛形了。

Python代碼
  1. # !/usr/bin/env python   
  2. # -*- coding:utf-8 -*-   
  3.   
  4. import Queue   
  5. import threading   
  6. import time   
  7.   
  8. class WorkManager(object):   
  9.     def __init__(self, work_num=1000,thread_num=2):   
  10.         self.work_queue = Queue.Queue()   
  11.         self.threads = []   
  12.         self.__init_work_queue(work_num)   
  13.         self.__init_thread_pool(thread_num)   
  14.   
  15.     """  
  16.         初始化線程  
  17.     """  
  18.     def __init_thread_pool(self,thread_num):   
  19.         for i in range(thread_num):   
  20.             self.threads.append(Work(self.work_queue))   
  21.   
  22.     """  
  23.         初始化工作隊列  
  24.     """  
  25.     def __init_work_queue(self, jobs_num):   
  26.         for i in range(jobs_num):   
  27.             self.add_job(do_job, i)   
  28.   
  29.     """  
  30.         添加一項工作入隊  
  31.     """  
  32.     def add_job(self, func, *args):   
  33.         self.work_queue.put((func, list(args)))#任務入隊,Queue內部實現了同步機制   
  34.   
  35.     """  
  36.         等待所有線程運行完畢  
  37.     """      
  38.     def wait_allcomplete(self):   
  39.         for item in self.threads:   
  40.             if item.isAlive():item.join()   
  41.   
  42. class Work(threading.Thread):   
  43.     def __init__(self, work_queue):   
  44.         threading.Thread.__init__(self)   
  45.         self.work_queue = work_queue   
  46.         self.start()   
  47.   
  48.     def run(self):   
  49.         #死循環,從而讓創建的線程在一定條件下關閉退出   
  50.         while True:   
  51.             try:   
  52.                 do, args = self.work_queue.get(block=False)#任務異步出隊,Queue內部實現了同步機制   
  53.                 do(args)   
  54.                 self.work_queue.task_done()#通知系統任務完成   
  55.             except:   
  56.                 break  
  57.   
  58. #具體要做的任務   
  59. def do_job(args):   
  60.     time.sleep(0.1)#模擬處理時間   
  61.     print threading.current_thread(), list(args)   
  62.   
  63. if __name__ == '__main__':   
  64.     start = time.time()   
  65.     work_manager =  WorkManager(1000010)#或者work_manager =  WorkManager(10000, 20)   
  66.     work_manager.wait_allcomplete()   
  67.     end = time.time()   
  68.     print "cost all time: %s" % (end-start)  

 2次開啟不同的線程數運行結果如下:

Python代碼
  1. #work_manager =  WorkManager(10000, 10)   
  2. cost all time: 100.641790867(單位:秒)   
  3. #work_manager =  WorkManager(10000, 20)   
  4. cost all time:50.5233478546(單位:秒)  

 上面實現了線程池的雛形,展現了基本原理,當然要想成為通用的API需要做很多的工作,希望本文能夠起到拋磚引玉的效果。

 本文由用戶 quguiliang 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!