常用建模方法
數據建模
世界上物品種類有千萬種,各種信息更是層出不窮,每種信息都有各自獨特的格式和表達方式,如何對信息進行描述,按照一定的方式進行轉化,使之形成適合存儲的數據格式,稱之為建模。常用的有實體建模法,維度建模法,范式建模法三種數據建模方法,不管哪種數據建模方法都是使信息結構清晰、易于存儲和讀取。
(1)實體建模法
?實體是現實世界中存在的事物或發生的事件,是現實世界中任何可識別、可區分的事物。實體可以是人,可以是物,也可以是發生的某件事,比如一場籃球比賽。每一個實體都必須具備一定的特征,用來區分一個個實體,這些特征稱為屬性,每個實體可以用若干個屬性來刻畫,每個屬性又有一定的取值類型和取值范圍,屬性是變量,其取值范圍是屬性的值域。實體建模法是根據客觀世界中的一個個實體,以及實體之間的關系,在數據建模的過程中引入這種區分方法,將整個業務分成一個個實體,從而建立數據模型。實體建模可以比較容易的實現模型的劃分,抽象出具體的業務概念,創建符合自己需要的數據庫模型。實體建模是對客觀世界的抽象,因此該方法建立的模型具有一定的局限性,適合于特定的領域。
(2)維度建模法
維度在數學上指獨立參數的數據,在數據分析領域,是指描述事物的角度和方面,是數據庫當中,描述某一事物的方法和屬性的數目。維度建模就是針對給定的事物,使用不同的描述方法,記錄該事物在不同分類方法當中每個屬性的值。如對人進行維度建模時,按照性別的維度可以分為男和女,按照年齡段可以分為兒童、少年、青年、中年、老年,按照收入水平可以分為3000以下、3000-6000、6000-10000,10000以上等集中類別。
?維度建模法的好處是對于某個事物,可以在各個維度進行預處理,進行統計、分類、排序等,提高數據庫操作性能,同時維度建模法建立的數據模型比較直觀,可以緊密圍繞業務需求建立模型,直觀的反應業務中的問題,建模方法簡單,不需要進行特別的抽象處理。但是維度建模法同時也存在缺點,一是在數據建模時需要進行預處理,存在大量的預處理工作,并且當業務需求發生變化時,需要重新定義維度,重新進行新維度的數據預處理,在數據預處理過程中往往存在大量數據冗余,另外就是在進行維度建模時,僅僅依靠維度進行建模,不能保證數據來源的準確性和一致性,不適合在數據庫底層使用。
(3)范式建模法
范式就是規則,是符合某一級別關系模式的集合,構造數據庫時必須遵循一定的規則。關系數據庫中的關系必須滿足一定的規則,即滿足不同的范式。
?范式建模法是將原始數據信息根據一定的數據結構和轉換模型,分解、轉化為規范的格式,使數據遵守一定的約束條件,每一個數據項所表達的意思明確,不產生歧義,同時各條數據之間相互獨立,不存在依賴關系。
?
總結
- 上一篇: 一篇文章入门Mysql
- 下一篇: 改善脑力的70条方法[翻译]