SQL Server 2014 RTM版本中的數據倉庫
英文原文:Data Warehousing in SQL Server 2014 RTM
SQL Server 2014 RTM 版已在 4 月 1 日對外發布。在此,我們將揭露新版 SQL Server 的各個新特性,尤其是數據倉庫的支持。
當然,我首先還是關注新版本的定價。
微軟公司正在推動一種綜合定價模式。這對他們來說非常重要,因為客戶會把其與 Oracle 公司的菜單式定價模式相比較。Oracle 是按照處理器個數收費,每個約 10,000 至 23,000 美金,一開始便宜,但要獲得它所有的功能,價格就增長至 47500/每個處理器。相比之下,SQL Server 企業版包含所有功能的前提下,統一價格 27000/每個處理器。
列存儲
早在 9 月,我們披露了新的可更新的列存儲表,而至今它還沒有什么真正的新功能。然而,我們對如何使用它,還有更多的建議。
首先,確保你有足夠的數據來證明它。 在一列存儲表中每個水平分區可容納多達一百萬行記錄。所以,如果你在一個單一的表中沒有成千上萬行數據,則這項技術對你而言并不合適。
另一個要考慮的是訪問模式。相比于傳統的行存儲,在列存儲結構中訪問一整行相對昂貴。所以我要再次強調,除非你正在使用掃描范圍的查詢,否則你不應使用這種技術。
下圖顯示了一個典型查詢的邏輯視圖。注意整段和列如何被消除,以減少I/O來處理查詢。
在性能方面,大多數查詢效率可提高至 5 到 10 倍。以一個基準來計算,它們比傳統的表“慣用索引”節約了 91% 的磁盤空間。
應該指出的是,雖然列存儲表被認為是它們的“內存數據庫”產品系列的一部分,但它們將內存池作為緩存使用,就像其他表一樣。但不像一個內存優化表,你在啟動時不必將整個表裝載到內存。
基于可持續復制的云服務平臺(Azure)
使用 Windows Azure 的虛擬機主機的可持續復制副本,現在已經可以實現,但還有難度。這些只讀的、且具有相同版本的數據庫可以分散在不同物理位置,以改善延遲和提高數據消費的吞吐量,就像用于靜態網頁文件的 CDN。由于它們是基于云的,因此人們理論上可以在需求高峰期啟動新的服務器,而不是在硬件空閑時期。
SQL Server 2014 新版本的主要變化是向導工具。SQL ServerManagement Studio 內置向導將引導管理員選擇虛擬機的大小和加載相應的加密密鑰。
為了鼓勵更多人使用這項服務,微軟只收取了虛擬機、存儲和出站流量的費用。從內部部署的 SQL Server 到 Azure 副本入口流量是免費的。
建立一個可持續復制副本時,選擇正確的同步模式非常重要。異步更新的副本使得寫入主數據庫的速度更快,但可能會導致讀取到過時的數據。 對于分析,尋找數周,數月,甚至數年的數據就沒有問題。 這使得它非常適合采用列存儲數據。
相反,同步更新允許用于 OLTP 數據的準確報告。但如果在主站和副本數據庫之間有顯著的延遲,那可能是嚴重的性能問題。因此,你不能把同步模式應用于物理上分散的服務器。
混合型數據庫和數據歸檔
SQL Server 的新功能是能夠創建真正的混合型數??據庫。 SQL Server 既可以運行于自身服務器上,也可以運行在 Azure 虛擬機上,當然它的部分或全部數據文件都在 Windows Azure 上存儲。
Windows Azure 擁有足夠大的緩沖池,在批量讀取大量文件時,它能提供高效訪問,保證性能。但可能會造成延遲問題,所以,這個功能在做數據歸檔時就顯得非常有用。 比如,你可以運行分析過去十年的銷售收據,又不用占用昂貴的 SAN 空間。
Windows Azure ExpressRoute服務
減輕延遲問題的一種方法是通過使用 Windows Azure 的快速干線Windows Azure ExpressRoute 服務,而非 V*N 服務器的網絡管道。這項服務提供了 Azure 數據中心與你本地設備之間的專用連接。
交換供應商提供 1 Gbps 和 10 Gbps 級得花費分別為每月 600 美金和 10000 美金。另外,每月超過 15/250TB 的流量費為 0.070/GB。
網絡服務提供商提供了不同的定價模型。起價 10Mbps,每月 600 美元;封頂 1Gbps,每月 12000 美元。單一方向不收取流量費。
注意,目前這個網站上的價格反映了 50% 預先折扣。
<span id="shareA4" class="fl"> </span>