</div>
</div>
# default file output is in user ’ s home directory.
# levels can be: SEVERE, WARNING, INFO, FINE, FINER, FINEST
java.util.logging.ConsoleHandler.level=SEVERE
java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
java.util.logging.FileHandler.append=true </pre><br />
通過上述的優化之后,性能有了大幅度的提升,從原來的 100 秒左右降到了 50 秒左右。為什么僅僅不記錄日志就能有如此大幅度的性能提升呢?查閱資料,發現已經有人做了相關的研究與實驗。經常聽到 Java 程序比 C/C++ 程序慢的言論,但是運行速度慢的真正原因是什么,估計很多人并不清楚。對于 CPU 密集型的程序(即程序中包含大量計算),Java 程序可以達到 C/C++ 程序同等級別的速度,但是對于 I/O 密集型的程序(即程序中包含大量 I/O 操作),Java 程序的速度就遠遠慢于 C/C++ 程序了,很大程度上是因為 C/C++ 程序能直接訪問底層的存儲設備。因此,不記錄日志而得到大幅度性能提升的原因是,Java 程序的 I/O 操作較慢,是一個很耗時的操作。
2. 針對數據庫連接的優化
共享數據庫連接。共有 5 次數據庫連接操作,每次都需重新建立數據庫連接,數據庫插入操作完成之后又立即釋放了,數據庫連接沒有被復用。為了做到共享數據庫連接,可以通過單例模式 (Singleton Pattern)獲得一個相同的數據庫連接,每次數據庫連接操作都共享這個數據庫連接。這里沒有使用數據庫連接池(Database Connection Pool)是因為在程序只有少量的數據庫連接操作,只有在大量并發數據庫連接的時候才需要連接池。
清單 2. 共享數據庫連接的代碼片段
public class JdbcUtil {
private static Connection con;
// 從配置文件讀取連接數據庫的信息
private static String driverClassName;
private static String url;
private static String username;
private static String password;
private static String currentSchema;
private static Properties properties = new Properties();
static {
// driverClassName, url, username, password, currentSchema 等從配置文件讀取,代碼略去
try {
Class.forName(driverClassName);
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
properties.setProperty("user", username);
properties.setProperty("password", password);
properties.setProperty("currentSchema", currentSchema);
try {
con = DriverManager.getConnection(url, properties);
} catch (SQLException e) {
e.printStackTrace();
}
}
private JdbcUtil() {}
// 獲得一個單例的、共享的數據庫連接
public static Connection getConnection() {
return con;
}
public static void close() throws SQLException {
if (con != null)
con.close();
}
} </pre><br />
通過上述的優化之后,性能有了小幅度的提升,從 50 秒左右降到了 40 秒左右。共享數據庫連接而得到的性能提升的原因是,數據庫連接是一個耗時耗資源的操作,需要同遠程計算機進行網絡通信,建立 TCP 連接,還需要維護連接狀態表,建立數據緩沖區。如果共享數據庫連接,則只需要進行一次數據庫連接操作,省去了多次重新建立數據庫連接的時間。
3. 針對插入數據庫記錄的優化 - 1
使用預編譯 SQL。具體做法是使用 java.sql.PreparedStatement 代替 java.sql.Statement 生成 SQL 語句。PreparedStatement 使得數據庫預先編譯好 SQL 語句,可以傳入參數。而 Statement 生成的 SQL 語句在每次提交時,數據庫都需進行編譯。在執行大量類似的 SQL 語句時,可以使用 PreparedStatement 提高執行效率。使用 PreparedStatement 的另一個好處是不需要拼接 SQL 語句,代碼的可讀性更強。通過上述的優化之后,性能有了小幅度的提升,從 40 秒左右降到了 30~35 秒左右。
清單 3. 使用 Statement 的代碼片段
</div>
</div>
// 需要拼接 SQL 語句,執行效率不高,代碼可讀性不強
StringBuilder sql = new StringBuilder();
sql.append("insert into table1(column1,column2) values('");
sql.append(column1Value);
sql.append("','");
sql.append(column2Value);
sql.append("');");
Statement st;
try {
st = con.createStatement();
st.executeUpdate(sql.toString());
} catch (SQLException e) {
e.printStackTrace();
}
清單 4. 使用 PreparedStatement 的代碼片段
// 預編譯 SQL 語句,執行效率高,可讀性強
String sql = “insert into table1(column1,column2) values(?,?)”;
PreparedStatement pst = con.prepareStatement(sql);
pst.setString(1,column1Value);
pst.setString(2,column2Value);
pst.execute();
4. 針對插入數據庫記錄的優化 - 2
使用 SQL 批處理。通過 java.sql.PreparedStatement 的 addBatch 方法將 SQL 語句加入到批處理,這樣在調用 execute 方法時,就會一次性地執行 SQL 批處理,而不是逐條執行。通過上述的優化之后,性能有了小幅度的提升,從 30~35 秒左右降到了 30 秒左右。
5. 針對多線程的優化
使用多線程實現并發 / 并行。清空數據庫表的操作、把從 2 個外部系統 D 取得的數據插入數據庫記錄的操作,是相互獨立的任務,可以給每個任務分配一個線程執行。清空數據庫表的操作應該先于數據庫插入操作完成,可以通過 java.lang.Thread 類的 join 方法控制線程執行的先后次序。在單核 CPU 時代,操作系統中某一時刻只有一個線程在運行,通過進程 / 線程調度,給每個線程分配一小段執行的時間片,可以實現多個進程 / 線程的并發(concurrent)執行。而在目前的多核多處理器背景下,操作系統中同一時刻可以有多個線程并行(parallel)執行,大大地提高了 計算速度。
清單 5. 使用多線程的代碼片段
</div>
</div>
</div>
</div>
Thread t0 = new Thread(new ClearTableTask());
Thread t1 = new Thread(new StoreServersTask(ADDRESS1));
Thread t2 = new Thread(new StoreServersTask(ADDRESS2));
try {
t0.start();
// 執行完清空操作后,再進行后續操作
t0.join();
t1.start();
t2.start();
t1.join();
t2.join();
} catch (InterruptedException e) {
e.printStackTrace();
}
// 斷開數據庫連接
try {
JdbcUtil.close();
} catch (SQLException e) {
e.printStackTrace();
} </pre><br />
通過上述的優化之后,性能有了大幅度的提升,從 30 秒左右降到了 15 秒以下,10~15 秒之間。使用多線程而得到的性能提升的原因是,系統部署所在的服務器是多核多處理器的,使用多線程,給每個任務分配一個線程執行,可以充分地利用 CPU 計算資源。
筆者試著給每個任務分配兩個線程執行,希望能使程序運行得更快,但是事與愿違,此時程序運行的時間反而比每個任務分配一個線程執行的慢,大約 20 秒。筆者推測,這是因為線程較多(相對于 CPU 的內核數),使得 CPU 忙于線程的上下文切換,過多的線程上下文切換使得程序的性能反而不如之前。因此,要根據實際的硬件環境,給任務分配適量的線程執行。
6. 針對設計模式的優化
使用 DAO 模式抽象出數據訪問層。原來的代碼中混雜著 JDBC 操作數據庫的代碼,代碼結構顯得十分凌亂。使用 DAO 模式(Data Access Object Pattern)可以抽象出數據訪問層,這樣使得程序可以獨立于不同的數據庫,即便訪問數據庫的代碼發生了改變,上層調用數據訪問的代碼無需改變。并且程 序員可以擺脫單調繁瑣的數據庫代碼的編寫,專注于業務邏輯層面的代碼的開發。通過上述的優化之后,性能并未有提升,但是代碼的可讀性、可擴展性大大地提高 了。
圖 2. DAO 模式的層次結構
清單 6. 使用 DAO 模式的代碼片段
</div>
</div>
// DeviceDAO.java,定義了 DAO 抽象,上層的業務邏輯代碼引用該接口,面向接口編程
public interface DeviceDAO {
public void add(Device device);
}
// DeviceDAOImpl.java,DAO 實現,具體的 SQL 語句和數據庫操作由該類實現
public class DeviceDAOImpl implements DeviceDAO {
private Connection con;
public DeviceDAOImpl() {
// 獲得數據庫連接,代碼略去
}
@Override
public void add(Device device) {
// 使用 PreparedStatement 進行數據庫插入記錄操作,代碼略去
}
} </pre><br />
回顧以上代碼優化過程:關閉日志記錄、共享數據庫連接、使用預編譯 SQL、使用 SQL 批處理、使用多線程實現并發 / 并行、使用 DAO 模式抽象出數據訪問層,程序運行時間從最初的 100 秒左右降低到 15 秒以下,在性能上得到了很大的提升,同時也具有了更好的可讀性和可擴展性。
四、結束語</span>
通過該項目實例,筆者深深地感到,想要寫出一個性能優化、可讀性可擴展性強的程序,需要對計算機系統的基本概念、原理,編程語言的特性,軟件系統架構設計 都有較深入的理解。“紙上得來終覺淺,絕知此事要躬行”,想要將這些基本理論、編程技巧融會貫通,還需要不斷地實踐,并總結心得體會。
本文由用戶
jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!
sesese色