一.概念
1.數據倉庫:是指面向主題的,一致的,不同時間的,穩定的數據集合,用於支持經營管理中的決策支持過程。從廣義上講數據倉庫是指存儲大量歷史數據的數據庫。每一個記錄代表特殊時間點上的一個數據。
它是一種把收集的各種數據轉變成有商業價值的信息技術,並把收集的信息體現在報告中。包括收集數據,過濾數據,存儲數據,之後把數據應用於分析、報告等應用程序。
2.數據倉庫目標:確認數據結構,尋找趨勢,輔助決策,為經營管理提供決策信息。
3..DSS:決策支持過程。
4.數據倉庫組成部分:數據市場,關系型數據庫,數據源,數據准備,種服務工具
5.維度:
6.多維:
7.聚合:獲取並集中一個群體或總和的結構.聚合是在一個多維層次內移動數據的概念.
9.類別:為類別和區分特定數據而分類的,在一個維度內,為提供詳細分類系統而定義的分類.
10.詳細類別:一個維度內最底層的分類.
11.分解與合成:
12.指標量:
13.OLAP:聯機分析
14.OLTP聯機事務處理
二.數據模型規范化
1. 概念:
規范化:是一個正規的方法,它應用一套規則使屬性和實體相關聯。
實體:是一個主要的數據對象,對用戶至關重要。它通常是將被記錄在數據庫中的一個人、一個地點、一樣東西或者一件事情。
屬性:實體包括屬性,屬性就是特征,修飾成分、質量、數量或者特性。
范式:規范化由幾個能夠減少褓以獲得更滿意的物理我的步驟組成,這些步驟稱為范式。
第一范式:一個不包含重復列的表歸於第一范式。
第二范式:如果一個表歸於第一范式且只包含依賴於主鍵的列,則歸於第二范式。
第三范式:如果一個表歸於第二范式且只包含那些非傳遞性地依賴於主鍵的列,則歸於第三范式。
二.信息需求建模:
1.自上而下建模方法:利用具體數據元素,將這些元素組織到各個維度與指標中,
2.自下而上建模方法:從用戶的觀點設計,優點是設計者可以轉紙一個通常主題或商務領域運
3.開發. 是自上而下與自下而上的方法的結合.
4.舉例:銷售收入應從預算和實際等角度表示.
指標:產品銷售的實際收入,產品銷售的預算收,產品銷售的估計收
維度:已經銷售的產品.
三.設計數據倉庫,經常詢部用戶的幾個問題?
1.用戶所在部門承擔的任務
2.用戶在部門中承擔的任務
3.為完成任務,用戶需哪些報表
4.目前從何處獲取這些信息?
5.得到信息如何處理?
6.信息是應用戶需要產生的,還是在定期報表中產生的?
7.用戶把信息輸入到過工作表中嗎?以便進一步分析嗎?
8.怎樣處理這些信息才算及時?
信息包的編制:
信息包:________________________
維度:____________________________________________
類別:
指標(預測銷售,實際銷售,預測偏差)
四.建立多維數據模型
要建立多維數據庫:
1. 選擇用來分析被建模主題的商業過程。
建模主題:比如想通過產品線和地區分析消費者的購買傾向來制訂市場策略,此時數據模型主題就是“銷售”。
2. 確定事實表的粒度。
事實表粒度通常代表每一個相關維的最底層。選擇以“天”為粒度,就表示“時間維”中的每一記錄代表一天。
3. 區分每一個事實表的維和層。
已定義的粒度與維相關。
4. 區分事實表的度量。
度量不僅包括數據本身,而且包括你從已存在的數據計算得到的新值。當設計數據模型時,必須做出決策:是否儲存事實表裡的計算結果或在運行階段獲得這些值。如:比值。
5. 確定每一個維表的屬性。
一般情況下,定義的每一個維表屬性的數量,應該保持最小。
6. 讓用戶驗證數據模型。
歡迎您給我發Email , 讓我們共同進步。
mailto:
[email protected] [email protected] [email protected]