JAVA線程池的分析和使用

jopen 12年前發布 | 14K 次閱讀 Java開發 Java

合理利用線程池能夠帶來三個好處。第一：降低資源消耗。通過重復利用已創建的線程降低線程創建和銷毀造成的消耗。第二：提高響應速度。當任務到達時，任務可以不需要等到線程創建就能立即執行。第三：提高線程的可管理性。線程是稀缺資源，如果無限制的創建，不僅會消耗系統資源，還會降低系統的穩定性，使用線程池可以進行統一的分配，調優和監控。但是要做到合理的利用線程池，必須對其原理了如指掌。

1. 引言

2. 線程池的使用

線程池的創建

我們可以通過ThreadPoolExecutor來創建一個線程池。

new  ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime, milliseconds,runnableTaskQueue, handler);

創建一個線程池需要輸入幾個參數：

corePoolSize（線程池的基本大小）：當提交一個任務到線程池時，線程池會創建一個線程來執行任務，即使其他空閑的基本線程能夠執行新任務也會創建線程，等到需要執行的任務數大于線程池基本大小時就不再創建。如果調用了線程池的prestartAllCoreThreads方法，線程池會提前創建并啟動所有基本線程。
runnableTaskQueue（任務隊列）：用于保存等待執行的任務的阻塞隊列。可以選擇以下幾個阻塞隊列。
- ArrayBlockingQueue：是一個基于數組結構的有界阻塞隊列，此隊列按 FIFO（先進先出）原則對元素進行排序。
- LinkedBlockingQueue：一個基于鏈表結構的阻塞隊列，此隊列按FIFO （先進先出）排序元素，吞吐量通常要高于ArrayBlockingQueue。靜態工廠方法Executors.newFixedThreadPool()使用了這個隊列。
- SynchronousQueue：一個不存儲元素的阻塞隊列。每個插入操作必須等到另一個線程調用移除操作，否則插入操作一直處于阻塞狀態，吞吐量通常要高于LinkedBlockingQueue，靜態工廠方法Executors.newCachedThreadPool使用了這個隊列。
- PriorityBlockingQueue：一個具有優先級的無限阻塞隊列。
maximumPoolSize（線程池最大大小）：線程池允許創建的最大線程數。如果隊列滿了，并且已創建的線程數小于最大線程數，則線程池會再創建新的線程執行任務。值得注意的是如果使用了無界的任務隊列這個參數就沒什么效果。
ThreadFactory：用于設置創建線程的工廠，可以通過線程工廠給每個創建出來的線程設置更有意義的名字。
RejectedExecutionHandler（飽和策略）：當隊列和線程池都滿了，說明線程池處于飽和狀態，那么必須采取一種策略處理提交的新任務。這個策略默認情況下是AbortPolicy，表示無法處理新任務時拋出異常。以下是JDK1.5提供的四種策略。
- AbortPolicy：直接拋出異常。
- CallerRunsPolicy：只用調用者所在線程來運行任務。
- DiscardOldestPolicy：丟棄隊列里最近的一個任務，并執行當前任務。
- DiscardPolicy：不處理，丟棄掉。
- 當然也可以根據應用場景需要來實現RejectedExecutionHandler接口自定義策略。如記錄日志或持久化不能處理的任務。
keepAliveTime（線程活動保持時間）：線程池的工作線程空閑后，保持存活的時間。所以如果任務很多，并且每個任務執行的時間比較短，可以調大這個時間，提高線程的利用率。
TimeUnit（線程活動保持時間的單位）：可選的單位有天（DAYS），小時（HOURS），分鐘（MINUTES），毫秒(MILLISECONDS)，微秒(MICROSECONDS, 千分之一毫秒)和毫微秒(NANOSECONDS, 千分之一微秒)。

向線程池提交任務

我們可以使用execute提交的任務，但是execute方法沒有返回值，所以無法判斷任務是否被線程池執行成功。通過以下代碼可知execute方法輸入的任務是一個Runnable類的實例。

threadsPool.execute(new Runnable() {
      @Override
      public void run() {
         // TODO Auto-generated method stub
      }
        });

我們也可以使用submit 方法來提交任務，它會返回一個future,那么我們可以通過這個future來判斷任務是否執行成功，通過future的get方法來獲取返回值，get方法會阻塞住直到任務完成，而使用get(long timeout, TimeUnit unit)方法則會阻塞一段時間后立即返回，這時有可能任務沒有執行完。

Future<Object> future = executor.submit(harReturnValuetask);
  try {
      Object s = future.get();
  } catch (InterruptedException e) {
      // 處理中斷異常
  } catch (ExecutionException e) {
      // 處理無法執行任務異常
  } finally {
      // 關閉線程池
      executor.shutdown();
  }

線程池的關閉

我們可以通過調用線程池的shutdown或shutdownNow方法來關閉線程池，它們的原理是遍歷線程池中的工作線程，然后逐個調用線程的 interrupt方法來中斷線程，所以無法響應中斷的任務可能永遠無法終止。但是它們存在一定的區別，shutdownNow首先將線程池的狀態設置成 STOP，然后嘗試停止所有的正在執行或暫停任務的線程，并返回等待執行任務的列表，而shutdown只是將線程池的狀態設置成SHUTDOWN狀態，然后中斷所有沒有正在執行任務的線程。

只要調用了這兩個關閉方法的其中一個，isShutdown方法就會返回true。當所有的任務都已關閉后,才表示線程池關閉成功，這時調用 isTerminaed方法會返回true。至于我們應該調用哪一種方法來關閉線程池，應該由提交到線程池的任務特性決定，通常調用shutdown來關閉線程池，如果任務不一定要執行完，則可以調用shutdownNow。

3. 線程池的分析

流程分析：線程池的主要工作流程如下圖：

JAVA線程池的分析和使用

從上圖我們可以看出，當提交一個新任務到線程池時，線程池的處理流程如下：

1.首先線程池判斷基本線程池是否已滿？沒滿，創建一個工作線程來執行任務。滿了，則進入下個流程。

2.其次線程池判斷工作隊列是否已滿？沒滿，則將新提交的任務存儲在工作隊列里。滿了，則進入下個流程。

3.最后線程池判斷整個線程池是否已滿？沒滿，則創建一個新的工作線程來執行任務，滿了，則交給飽和策略來處理這個任務。

源碼分析。上面的流程分析讓我們很直觀的了解了線程池的工作原理，讓我們再通過源代碼來看看是如何實現的。線程池執行任務的方法如下：

public void execute(Runnable command) {
    if (command == null)
       throw new NullPointerException();
    //如果線程數小于基本線程數，則創建線程并執行當前任務 
    if (poolSize >= corePoolSize || !addIfUnderCorePoolSize(command)) {
    //如線程數大于等于基本線程數或線程創建失敗，則將當前任務放到工作隊列中。
        if (runState == RUNNING && workQueue.offer(command)) {
            if (runState != RUNNING || poolSize == 0)
                      ensureQueuedTaskHandled(command);
        }
    //如果線程池不處于運行中或任務無法放入隊列，并且當前線程數量小于最大允許的線程數量，則創建一個線程執行任務。
        else if (!addIfUnderMaximumPoolSize(command))
        //拋出RejectedExecutionException異常
            reject(command); // is shutdown or saturated
    }
}

工作線程。線程池創建線程時，會將線程封裝成工作線程Worker，Worker在執行完任務后，還會無限循環獲取工作隊列里的任務來執行。我們可以從Worker的run方法里看到這點：

public void run() {
     try {
           Runnable task = firstTask;
           firstTask = null;
            while (task != null || (task = getTask()) != null) {
                    runTask(task);
                    task = null;
            }
      } finally {
             workerDone(this);
      }
}

4. 合理的配置線程池

要想合理的配置線程池，就必須首先分析任務特性，可以從以下幾個角度來進行分析：

1.任務的性質：CPU密集型任務，IO密集型任務和混合型任務。

2.任務的優先級：高，中和低。

3.任務的執行時間：長，中和短。

4.任務的依賴性：是否依賴其他系統資源，如數據庫連接。

任務性質不同的任務可以用不同規模的線程池分開處理。CPU密集型任務配置盡可能小的線程，如配置Ncpu+1個線程的線程池。IO密集型任務則由于線程并不是一直在執行任務，則配置盡可能多的線程，如2*Ncpu。混合型的任務，如果可以拆分，則將其拆分成一個CPU密集型任務和一個IO密集型任務，只要這兩個任務執行的時間相差不是太大，那么分解后執行的吞吐率要高于串行執行的吞吐率，如果這兩個任務執行時間相差太大，則沒必要進行分解。我們可以通過 Runtime.getRuntime().availableProcessors()方法獲得當前設備的CPU個數。

優先級不同的任務可以使用優先級隊列PriorityBlockingQueue來處理。它可以讓優先級高的任務先得到執行，需要注意的是如果一直有優先級高的任務提交到隊列里，那么優先級低的任務可能永遠不能執行。

執行時間不同的任務可以交給不同規模的線程池來處理，或者也可以使用優先級隊列，讓執行時間短的任務先執行。

依賴數據庫連接池的任務，因為線程提交SQL后需要等待數據庫返回結果，如果等待的時間越長CPU空閑時間就越長，那么線程數應該設置越大，這樣才能更好的利用CPU。

建議使用有界隊列，有界隊列能增加系統的穩定性和預警能力，可以根據需要設大一點，比如幾千。有一次我們組使用的后臺任務線程池的隊列和線程池全滿了，不斷的拋出拋棄任務的異常，通過排查發現是數據庫出現了問題，導致執行SQL變得非常緩慢，因為后臺任務線程池里的任務全是需要向數據庫查詢和插入數據的，所以導致線程池里的工作線程全部阻塞住，任務積壓在線程池里。如果當時我們設置成無界隊列，線程池的隊列就會越來越多，有可能會撐滿內存，導致整個系統不可用，而不只是后臺任務出現問題。當然我們的系統所有的任務是用的單獨的服務器部署的，而我們使用不同規模的線程池跑不同類型的任務，但是出現這樣問題時也會影響到其他任務。

5. 線程池的監控

通過線程池提供的參數進行監控。線程池里有一些屬性在監控線程池的時候可以使用

taskCount：線程池需要執行的任務數量。
completedTaskCount：線程池在運行過程中已完成的任務數量。小于或等于taskCount。
largestPoolSize：線程池曾經創建過的最大線程數量。通過這個數據可以知道線程池是否滿過。如等于線程池的最大大小，則表示線程池曾經滿了。
getPoolSize:線程池的線程數量。如果線程池不銷毀的話，池里的線程不會自動銷毀，所以這個大小只增不+ getActiveCount：獲取活動的線程數。

通過擴展線程池進行監控。通過繼承線程池并重寫線程池的beforeExecute，afterExecute和terminated方法，我們可以在任務執行前，執行后和線程池關閉前干一些事情。如監控任務的平均執行時間，最大執行時間和最小執行時間等。這幾個方法在線程池里是空方法。如：

protected void beforeExecute(Thread t, Runnable r) { }

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/lib/view/open1386252595111.html

Java開發 Java

JAVA線程池的分析和使用

相關經驗

相關資訊

相關文檔

目錄