數據庫故障恢復技術解析
來自: http://blog.csdn.net/dingding_12345/article/details/50465075
一、數據倉庫的定義
將來自多個數據源的數據,以統一的模式,集中存儲在某個站點上。其特征是:歷史數據,海量的數據,數據只添加,只讀,無修改.
二、數據倉庫的開發過程
先看一張圖,如下
1、確定建立數據倉庫要解決的問題,明確主題下的查詢分析需求;
2、選擇數據倉庫軟件平臺,包括數據庫,建模工具,分析工具;
3、建立數據倉庫的邏輯模型,并在軟件平臺下加以實現;
4、對來自不同數據源的異構數據,根據數據模型進行清洗和轉換,匯聚到數據倉庫中
5、開發數據倉庫的分析應用。
三、數據倉庫與數據庫的區別
先上圖,直觀一點。
查了資料,引用知乎上的一個回答。
1,邏輯層面/概念層面:數據庫和數據倉庫其實是一樣的或者及其相似的,都是通過某個數據庫軟件,基于某種數據模型來組織、管理數據。但是,數據庫通常更關注業務交易處理(OLTP),而數據倉庫更關注數據分析層面(OLAP),由此產生的數據庫模型上也會有很大的差異。數據庫通常追求交易的速度,交易完整性,數據的一致性,等等,在數據庫模型上主要遵從范式模型(1NF,2NF,3NF,等等),從而盡可能減少數據冗余,保證引用完整性;而數據倉庫強調數據分析的效率,復雜查詢的速度,數據之間的相關性分析,所以在數據庫模型上,數據倉庫喜歡使用多維模型,從而提高數據分析的效率。
2,產品實現層面:數據庫和數據倉庫軟件是有些不同的,數據庫通常使用行式存儲,如SAP ASE,Oracle, Microsoft SQL Server,而數據倉庫傾向使用列式存儲,如SAP IQ,SAP HANA
簡要的說,數據庫是面對業務處理的, 即OLTP,而數據倉庫是側重在分析層面,即OLAP.
以上是自己的個人總結,如有不妥當之處,請在評論中指出!
</div>