如何通過編程發現Java死鎖

jopen 9年前發布 | 12K 次閱讀 Java死鎖 Java開發

死鎖是指,兩個或多個動作一直在等待其他動作完成而使得所有動作都始終處在阻塞的狀態。想要在開發階段檢測到死鎖是非常困難的,而想要解除死鎖往往需要重新啟動程序。更糟的是,死鎖通常發生在負載最重的生產過程中,而想要在測試中發現它,十分不易。之所以這么說,是因為測試線程之間所有可能的交叉是不現實的。盡管出現了一些靜態分析庫可以幫助我們發現可能出現的死鎖,我們還是有必要在運行時檢測到死鎖,并且得到有用的信息,以便我們解決這個問題或者重啟程序,或者做些其他的事情。

在編程中使用ThreadMXBean類來檢測死鎖

Java 5引入了ThreadMXBean接口,它提供了多種監視線程的方法。我建議您了解所有這些方法,因為當您沒使用外部工具時,它們會為您提供很多有用的操作以便您監測程序性能。這里,我們感興趣的方法是findMonitorDeadlockedThreads,如過您使用的是Java 6,對應的方法是findDeadlockedThreads。二者的區別的是,findDeadlockedThreads還可以檢測到owner locks(java.util.concurrent)引起的死鎖,而findMonitorDeadlockedThreads只能檢測monitor locks(例如,同步塊)。由于保留老版本的方法只是出于兼容性的考慮,所以我將使用新版本的方法。在這里,編程的思想是把對死鎖的周期性檢測封裝到一個可重用組件里,之后我們只需啟動它、隨它去。

一種實現調度的方法是通過執行器框架,即一組良好抽象并易于使用的多線程類。

ScheduledExecutorService scheduler = Executors.newScheduledThreadPool(1);
this.scheduler.scheduleAtFixedRate(deadlockCheck, period, period, unit);

就是那么簡單,在我們通過選擇周期和時間單位而設置了一個特定時間后,就得到了一個周期性調用的線程。接著,我們想使功用得以拓展從而允許用戶提供在程序檢測到死鎖時所觸發的行為。最后,我們需要一個方法來接收用于描述死鎖中所有線程的一系列對象。

void handleDeadlock(final ThreadInfo[] deadlockedThreads);

現在,實現死鎖檢測類已經萬事俱備了。

public interface DeadlockHandler {
  void handleDeadlock(final ThreadInfo[] deadlockedThreads);
}

public class DeadlockDetector {

  private final DeadlockHandler deadlockHandler;
  private final long period;
  private final TimeUnit unit;
  private final ThreadMXBean mbean = ManagementFactory.getThreadMXBean();
  private final ScheduledExecutorService scheduler = 
  Executors.newScheduledThreadPool(1);

  final Runnable deadlockCheck = new Runnable() {
    @Override
    public void run() {
      long[] deadlockedThreadIds = DeadlockDetector.this.mbean.findDeadlockedThreads();

      if (deadlockedThreadIds != null) {
        ThreadInfo[] threadInfos = 
        DeadlockDetector.this.mbean.getThreadInfo(deadlockedThreadIds);

        DeadlockDetector.this.deadlockHandler.handleDeadlock(threadInfos);
      }
    }
  };

  public DeadlockDetector(final DeadlockHandler deadlockHandler, 
    final long period, final TimeUnit unit) {
    this.deadlockHandler = deadlockHandler;
    this.period = period;
    this.unit = unit;
  }

  public void start() {
    this.scheduler.scheduleAtFixedRate(
    this.deadlockCheck, this.period, this.period, this.unit);
  }
}

讓我們動手試試。首先,我們要創建一個handler用來向System.err輸出死鎖線程的信息。在現實場景中,我們可以用它發送郵件,比如:

public class DeadlockConsoleHandler implements DeadlockHandler {

  @Override
  public void handleDeadlock(final ThreadInfo[] deadlockedThreads) {
    if (deadlockedThreads != null) {
      System.err.println("Deadlock detected!");

      Map<Thread, StackTraceElement[]> stackTraceMap = Thread.getAllStackTraces();
      for (ThreadInfo threadInfo : deadlockedThreads) {

        if (threadInfo != null) {

          for (Thread thread : Thread.getAllStackTraces().keySet()) {

            if (thread.getId() == threadInfo.getThreadId()) {
              System.err.println(threadInfo.toString().trim());

              for (StackTraceElement ste : thread.getStackTrace()) {
                  System.err.println("t" + ste.toString().trim());
              }
            }
          }
        }
      }
    }
  }
}

這一過程在所有的堆棧追蹤中反復進行并為每個線程信息打印對應的堆棧蹤跡。通過這種方式,我們可以準確知道每個線程等待的位置和對象。但這個方法有一個缺陷——當一個線程只是暫時等待時,可能會被當作一個暫時的死鎖,從而引發錯誤的警報。出于此,當我們處理死鎖時,原始線程不能繼續存在而findDeadlockedThreads方法會返回沒有此類線程。為了避免可能出現的NullPointerException,我們需要警惕這種情況。最后,讓我們促成一個死鎖來看看系統是如何運行的。

DeadlockDetector deadlockDetector = new DeadlockDetector(new DeadlockConsoleHandler(), 5, TimeUnit.SECONDS);
deadlockDetector.start();

final Object lock1 = new Object();
final Object lock2 = new Object();

Thread thread1 = new Thread(new Runnable() {
  @Override
  public void run() {
    synchronized (lock1) {
      System.out.println("Thread1 acquired lock1");
      try {
        TimeUnit.MILLISECONDS.sleep(500);
      } catch (InterruptedException ignore) {
      }
      synchronized (lock2) {
        System.out.println("Thread1 acquired lock2");
      }
    }
  }

});
thread1.start();

Thread thread2 = new Thread(new Runnable() {
  @Override
  public void run() {
    synchronized (lock2) {
      System.out.println("Thread2 acquired lock2");
      synchronized (lock1) {
        System.out.println("Thread2 acquired lock1");
      }
    }
  }
});
thread2.start();

輸出:

Thread1 acquired lock1
Thread2 acquired lock2
Deadlock detected!
“Thread-1” Id=11 BLOCKED on java.lang.Object@68ab95e6 owned by “Thread-0” Id=10
deadlock.DeadlockTester$2.run(DeadlockTester.java:42) 
 java.lang.Thread.run(Thread.java:662)
“Thread-0” Id=10 BLOCKED on java.lang.Object@58fe64b9 owned by “Thread-1” Id=11
 deadlock.DeadlockTester$1.run(DeadlockTester.java:28)
 java.lang.Thread.run(Thread.java:662)

記住,死鎖檢測的開銷可能會很大,你需要用你的程序來測試一下你是否真的需要死鎖檢測以及多久檢測一次。我建議死鎖檢測的時間間隔至少為幾分鐘,因為更加頻繁的檢測并沒有太大的意義,原因是我們并沒有一個復原計劃,我們能做的只是調試和處理錯誤或者重啟程序并祈禱不會再次發生死鎖。如果你有關于解決死鎖問題的好建議或者關于這個解決方案的疑問,請在下面留言。

原文鏈接: Dzone 翻譯: ImportNew.com - rookie_sam
譯文鏈接: http://www.importnew.com/15307.html

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!