模型设计的三个阶段
1.概念模型
概念模型主要是通過分析和歸納,將業務劃分成幾個主題,并確定主體之間的關系:
業務:即一個總指標,一般來說,一個業務來自于一個OLTP數據庫。例如自然人 法人這兩個不同的業務,來自01 02數據庫。
主題:即一個主題可以分析歸納出的某幾種具體生活常識中的總結點,例如自然人的 動產 不動產等。
- 電影行業:影院、影片、影人、用戶、訂單、渠道、發行等
- 出行行業:司機、乘客、訂單、支付、車輛等
2.邏輯模型
邏輯模型是指在概念模型的基礎上,定義數據倉庫各種實體、屬性、關系,指導后續的數據存儲、組織和數據應用的開發。兩種建模理論:自下而上范式建模(DW-DM數據倉庫-數據模型) 自上而下維度建模(DM-DW數據模型-數據倉庫)
范式建模:
- 第一范式 (原子性,數據不可分割。例如所在城市這一字段:省市縣區(多義) -> 【可分割出字段】省 市 縣 區這四個字段 [這時數據庫中可能存在非 distinct的數據])
- 第二范式 (唯一性,主鍵唯一性,非主屬性 完全 依賴于主屬性)
- 第三范式 (獨立性,例如字段中存在城市dm代碼 和 城市mc名稱,其實這兩個字段是可以傳遞依賴 遞推出來的,這時候只需dm這一個字段就行,保證了字段之間完全獨立,沒有傳遞依賴)
維度建模: - 星型 (星形更傾向于大寬表,在一張表中存在較多的冗余信息)
- 雪花型 (雪花型會產生較多的維表,多級關聯)
星型:由一個事實表和一組維表組成,每個維表都有一個維度作為主鍵,事實表居中,多個維表呈輻射狀分布于其四周,并與事實表連接,形成一個星型結構。
雪花型:在星型模型的基礎上,基于范式理論進一步層級化,將某些維表擴展成事實表,最終形成雪花狀結構。 【這一過程需要從最底層級倒退各個維表的dm mc,也可以不倒退,邏輯性更差一點】
3.物理模型
物理模型設計是指根據邏輯模型設計的結構為基礎,設計數據對象的物理實現,比如表的命名規范、字段的命名規范、字段類型選擇、分區設置、存儲設置、更行方式、調度配置(調度時間、父子節點等)
4.總結
現實過程中,實際模型和邏輯模型不一定一致,例如數據倉庫中:
總結
- 上一篇: 网站服务器1 mbps,1mbps网速快
- 下一篇: 笔记|滴滴iOS客户端的架构,组件化,技