阿里OneData构建数据指标体系
數據指標來輔助業務決策
GMV、日活用戶、月活用戶、PV、UV、頁面停留時長
OneData指標規范
以維度建模作為理論基礎,構建總線矩陣,定義業務域、數據域、業務過程、度量/原子指標、維度、維度屬性、修飾詞、修飾類型、時間周期、派生指標等。
業務域:比數據域更高維度的業務劃分方法,適用于特別龐大的業務系統,且業務板塊之間的指標或業務重疊性較小。例如用車業務板塊包含乘客端、司機端,電商業務板塊包含商城、返利模塊。
業務過程:業務過程可以概括為一個個不可拆分的行為事件,如下單、支付、評價等業務過程/事件。這里的事件跟埋點的事件類似,詳情可查看
業務域倒還能理解,簡單來說就是對不同業務的分類;業務過程也容易理解,相當于畫業務流程圖
數據域:是聯系較為緊密的數據主題的集合,是對業務對象高度概括的概念層歸類,目的是便于數據管理與應用。簡而言之,數據域就類似于我們電腦桌面要建立不同的文件夾來存儲數據,這些個文件夾名就是數據域。
維度:是度量的環境,用來反映業務的一類屬性,這類屬性的集合構成一個維度,可以從who-where-when-what層面來看。
維度屬性:維度屬性隸屬于維度,相當于維度的具體說明,如用戶維度中性別為男、女。
修飾詞:指除了統計維度以外指標的業務場景。
修飾類型:對修飾詞的抽象劃分。
簡而言之,維度和修飾都可以理解為原子指標的一些限定條件,懂sql的會更好理解一些,一般是寫sql時,放在where語句后邊的。
度量/原子指標:原子指標和度量含義相同,某一業務行為事件下的度量,是業務定義中不可拆分的指標,如注冊數。
時間周期:用來明確數據統計的時間范圍或是時間點,如最近30天、自然周、截至當日等。
指標類型:包含原子指標、派生指標。原子指標 = 行為事件+度量派生指標 = 一個原子指標+多個修飾詞+時間周期
例如:原子指標=完單量,派生指標=近一周iOS乘客完單量,包含時間周期=近一周,修飾詞=iOS,維度=乘客,原子指標=完單量。
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
模型設計
此時主導的是我們的模型設計工程師,按照阿里的OneData建模理論的指導,模型設計工程師會采用三層建模的方式把數據更加科學的組織存儲。分為 ODS(操作數據層),DWD(明細數據層)、DWS(匯總數據層)、ADS (應用數據層),這是業務對數據分層常用的模型。
阿里的一套針對指標的規范定義,讓大家在一個標準下看數據消除歧義(指標拆分體系)
數據域:面向業務的大模塊,不會經常變。比如我們公司有環貿快版打版服務、億訂電商業務、供應鏈業務等等大的業務模塊類似產品線。
業務過程:如電商業務中的下單、支付、退款等都屬于業務過程。
時間周期:就是統計范圍,如近30天、自然周、截止到當天等。
修飾類型:比較好理解的如電商中支付方式,終端類型等。
修飾詞:除了維度意外的限定詞,如電商支付中的微信支付、支付寶支付、網銀支付等。終端類型為安卓、IOS等
原子指標:不可再拆分的指標如支付金額、支付件數等指標
維度:常見的維度有地理維度(國家、地區等)、時間維度(年、月、周、日等)
維度屬性:如地理維度中的國家名稱、ID、省份名稱等。
派生指標:原子指標+修飾詞+時間周期就組成了一個派生指標。
關于數據指標還有two more thing要談:
1. 怎么分出指標的重要性。績效考核指標,部門負責人關注的指標
2. 關于虛榮指標。
PV、UV、月活、總用戶數、總商品數
主路徑的專戶率,訪問-商品列表、商品列表-商品詳情、商品詳情-加購、加購-下單轉化率:降低流失就能提高交易額的。
用戶的次日留存、7日留存率(新用戶7日后是否再次訪問)、30日留存率:等能直接反應用戶的質量和運營做的好壞。
商品的動銷率(銷售款數/上架款數):能直接反映這批商品的好壞。
基于阿里OneData的模型設計體系
首先你要知道這些概念。什么是數據倉庫、數據倉庫和數據庫的區別、數據倉庫的分層、數據模型的定義。
數據倉庫與數據庫的區別
阿里的數據分層分為:ODS、DWD、DWS、ADS。
ODS(操作數據層):是數據倉庫第一層數據,直接從原始數據過來的,經過簡單地處理,爆款率涉及到的表結構比如訂單表、專場表、商品表、用戶表等。
DW*(匯總數據層):這個是數據倉庫的第二層數據,DWD和DWS很多情況下是并列存在的,這一層儲存經過處理后的標準數據。增加了維度形成了統計寬表,比如專場的爆款商品有哪些。
ADS(應用數據層):這個是數據倉庫的最后一層數據,為應用層數據,直接可以給業務人員使用。比如某日某個專場爆款率是多少、總的爆款率是什么。
數據模型有很多,如:范式模型、維度模型、Data Vault
星型模型的基本概念
星型模型中有兩個重要的概念:事實表和維度表。
總結
以上是生活随笔為你收集整理的阿里OneData构建数据指标体系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SAP Hybris Commerce里
- 下一篇: 无尽恢复药水有什么用