SQL Server數據庫開發經驗

bnmyn 13年前發布 | 3K 次閱讀 GWT ActionScript 輸入法 IntelliJ IDEA Windows
教程由JAVA中文網整理校對發布(javaweb.cc)

一、了解你用的工具 
不要輕視這一點,這是我在這篇文章中講述的最關鍵的一條。也許你也看到有很多的SQL Server程序員沒有掌握全部的T-SQL命令和SQL Server提供的那些有用的工具。 
“什么?我要浪費一個月的時間來學習那些我永遠也不會用到的SQL命令???”,你也許會這樣說。對的,你不需要這樣做。但是你應該用一個周末瀏覽所有的T-SQL命令。在這里,你的任務是了解,將來,當你設計一個查詢時,你會記起來:“對了,這里有一個命令可以完全實現我需要的功能”,于是,到MSDN查看這個命令的確切語法。 
二、不要使用游標 
讓我再重復一遍:不要使用游標。如果你想破壞整個系統的性能的話,它們倒是你最有效的首選辦法。大多數的初學者都使用游標,而沒有意識到它們對性能造成的影響。它們占用內存,還用它們那些不可思議的方式鎖定表,另外,它們簡直就像蝸牛。而最糟糕的是,它們可以使你的DBA所能做的一切性能優化等于沒做。不知你是否知道每執行一次FETCH就等于執行一次Select命令?這意味著如果你的游標有10000條記錄,它將執行10000次Select!如果你使用一組Select、Update或者Delete來完成相應的工作,那將有效率的多。 
初學者一般認為使用游標是一種比較熟悉和舒適的編程方式,可很不幸,這會導致糟糕的性能。顯然,SQL的總體目的是你要實現什么,而不是怎樣實現。 
我曾經用T-SQL重寫了一個基于游標的存儲過程,那個表只有100,000條記錄,原來的存儲過程用了40分鐘才執行完畢,而新的存儲過程只用了10秒鐘。在這里,我想你應該可以看到一個不稱職的程序員究竟在干了什么!!! 
我們可以寫一個小程序來取得和處理數據并且更新數據庫,這樣做有時會更有效。記住:對于循環,T-SQL無能為力。 
我再重新提醒一下:使用游標沒有好處。除了DBA的工作外,我從來沒有看到過使用游標可以有效的完成任何工作。 

--SET STATISTICS TIME off
if exists (select * from sys.objects where object_id = OBJECT_ID(N'[dbo].[for_cursor_test]') and type in (N'U'))
drop table for_cursor_test
go
create table for_cursor_test
(
id int primary key,
name varchar(20) not null,
age int not null,
intro varchar(200)
)
go
declare @cnt int
select @cnt=1
while @cnt <=10000
begin
insert into for_cursor_test values (@cnt,'名字'+convert(char(5),@cnt),@cnt%20,'簡介')
select @cnt=@cnt+1
end
--select * from for_cursor_test
DECLARE vend_cursor CURSOR
    FOR SELECT * FROM for_cursor_test
OPEN vend_cursor
WHILE @@FETCH_STATUS = 0
BEGIN
FETCH NEXT FROM vend_cursor
end
CLOSE vendor_cursor
DEALLOCATE vendor_cursor
“在執行批處理時出現錯誤。錯誤消息為: 引發類型為“System.OutOfMemoryException”的異常。”明顯感覺執行很慢。
三、規范化你的數據表 
為什么不規范化數據庫?大概有兩個借口:出于性能的考慮和純粹因為懶惰。至于第二點,你遲早得為此付出代價。而關于性能的問題,你不需要優化根本就不慢的東西。我經常看到一些程序員“反規范化”數據庫,他們的理由是“原來的設計太慢了”,可結果卻常常是他們讓系統更慢了。DBMS被設計用來處理規范數據庫的,因此,記住:按照規范化的要求設計數據庫。 
四、不要使用Select * 
這點不太容易做到,我太了解了,因為我自己就經常這樣干。可是,如果在Select中指定你所需要的列,那將會帶來以下的好處: 
1 減少內存耗費和網絡的帶寬 
2 你可以得到更安全的設計 
3 給查詢優化器機會從索引讀取所有需要的列 
五、了解你將要對數據進行的操作 
為你的數據庫創建一個健壯的索引,那可是功德一件。可要做到這一點簡直就是一門藝術。每當你為一個表添加一個索引,Select會更快了,可Insert和Delete卻大大的變慢了,因為創建了維護索引需要許多額外的工作。顯然,這里問題的關鍵是:你要對這張表進行什么樣的操作。這個問題不太好把握,特別是涉及Delete和Update時,因為這些語句經常在Where部分包含Select命令。 
六、不要給“性別”列創建索引 
首先,我們必須了解索引是如何加速對表的訪問的。你可以將索引理解為基于一定的標準上對表進行劃分的一種方式。如果你給類似于“性別”這樣的列創建了一個索引,你僅僅是將表劃分為兩部分:男和女。你在處理一個有1,000,000條記錄的表,這樣的劃分有什么意義?記住:維護索引是比較費時的。當你設計索引時,請遵循這樣的規則:根據列可能包含不同內容的數目從多到少排列,比如:姓名+省份+性別。 
七、使用事務 
請使用事務,特別是當查詢比較耗時。如果系統出現問題,這樣做會救你一命的。一般有些經驗的程序員都有體會-----你經常會碰到一些不可預料的情況會導致存儲過程崩潰。 
八、小心死鎖 
按照一定的次序來訪問你的表。如果你先鎖住表A,再鎖住表B,那么在所有的存儲過程中都要按照這個順序來鎖定它們。如果你(不經意的)某個存儲過程中先鎖定表B,再鎖定表A,這可能就會導致一個死鎖。如果鎖定順序沒有被預先詳細的設計好,死鎖是不太容易被發現的。 
九、不要打開大的數據集 
一個經常被提出的問題是:我怎樣才能迅速的將100000條記錄添加到ComboBox中?這是不對的,你不能也不需要這樣做。很簡單,你的用戶要瀏覽100000條記錄才能找到需要的記錄,他一定會詛咒你的。在這里,你需要的是一個更好的UI,你需要為你的用戶顯示不超過100或200條記錄。 
十、不要使用服務器端游標 
與服務器端游標比起來,客戶端游標可以減少服務器和網絡的系統開銷,并且還減少鎖定時間。 
十一、使用參數查詢 
有時,我在CSDN技術論壇看到類似這樣的問題:“Select * FROM a Where a.id='A'B,因為單引號查詢發生異常,我該怎么辦?”,而普遍的回答是:用兩個單引號代替單引號。這是錯誤的。這樣治標不治本,因為你還會在其他一些字符上遇到這樣的問題,更何況這樣會導致嚴重的bug,除此以外,這樣做還會使SQL Server的緩沖系統無法發揮應有的作用。使用參數查詢, 釜底抽薪,這些問題統統不存在了。 
十二、在程序編碼時使用大數據量的數據庫 
程序員在開發中使用的測試數據庫一般數據量都不大,可經常的是最終用戶的數據量都很大。我們通常的做法是不對的,原因很簡單:現在硬盤不是很貴,可為什么性能問題卻要等到已經無可挽回的時候才被注意呢? 
十三、不要使用Insert導入大批的數據 
請不要這樣做,除非那是必須的。使用UTS或者BCP,這樣你可以一舉而兼得靈活性和速度。 
十四、注意超時問題 
查詢數據庫時,一般數據庫的缺省都比較小,比如15秒或者30秒。而有些查詢運行時間要比這長,特別是當數據庫的數據量不斷變大時。 
十五、不要忽略同時修改同一記錄的問題 
有時候,兩個用戶會同時修改同一記錄,這樣,后一個修改者修改了前一個修改者的操作,某些更新就會丟失。處理這種情況不是很難:創建一個timestamp字段,在寫入前檢查它,如果允許,就合并修改,如果存在沖突,提示用戶。 
十六、在細節表中插入紀錄時,不要在主表執行Select MAX(ID) 
這是一個普遍的錯誤,當兩個用戶在同一時間插入數據時,這會導致錯誤。你可以使用SCOPE_IDENTITY,IDENT_CURRENT和IDENTITY。如果可能,不要使用IDENTITY,因為在有觸發器的情況下,它會引起一些問題(詳見這里的討論)。 
十七、避免將列設為NULLable 
如果可能的話,你應該避免將列設為NULLable。系統會為NULLable列的每一行分配一個額外的字節,查詢時會帶來更多的系統開銷。另外,將列設為NULLable使編碼變得復雜,因為每一次訪問這些列時都必須先進行檢查。 
我并不是說NULLS是麻煩的根源,盡管有些人這樣認為。我認為如果你的業務規則中允許“空數據”,那么,將列設為NULLable有時會發揮很好的作用,但是,如果在類似下面的情況中使用NULLable,那簡直就是自討苦吃。 
CustomerName1 
CustomerAddress1 
CustomerEmail1 
CustomerName2 
CustomerAddress2 
CustomerEmail3 
CustomerName1 
CustomerAddress2 
CustomerEmail3 
如果出現這種情況,你需要規范化你的表了。 
十八、盡量不要使用TEXT數據類型 
除非你使用TEXT處理一個很大的數據,否則不要使用它。因為它不易于查詢,速度慢,用的不好還會浪費大量的空間。一般的,VARCHAR可以更好的處理你的數據。 
十九、盡量不要使用臨時表 
盡量不要使用臨時表,除非你必須這樣做。一般使用子查詢可以代替臨時表。使用臨時表會帶來系統開銷,如果你是用COM+進行編程,它還會給你帶來很大的麻煩,因為COM+使用數據庫連接池而臨時表卻自始至終都存在。SQL Server提供了一些替代方案,比如Table數據類型。 
二十、學會分析查詢 
SQL Server查詢分析器是你的好伙伴,通過它你可以了解查詢和索引是如何影響性能的。 
二十一、使用參照完整性 
定義主健、唯一性約束和外鍵,這樣做可以節約大量的時間。



21條SQL Server數據庫開發經驗(本教程僅供研究和學習,不代表JAVA中文網觀點)
本篇文章鏈接地址:http://www.javaweb.cc/database/mssql/021848.shtml
如需轉載請注明出自JAVA中文網:http://www.javaweb.cc/

 本文由用戶 bnmyn 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!