大数据之数据质量
大數(shù)據(jù)之?dāng)?shù)據(jù)質(zhì)量
- 一、數(shù)據(jù)質(zhì)量評(píng)估
- 1. 完整性
- 2. 準(zhǔn)確性
- 3. 及時(shí)性
- 4. 一致性
- 二、如何提升數(shù)據(jù)質(zhì)量
- 1. 事前定義數(shù)據(jù)的監(jiān)控規(guī)則
- 2. 事中監(jiān)控和控制數(shù)據(jù)生產(chǎn)過(guò)程
- 3. 事后分析和問題跟蹤
一、數(shù)據(jù)質(zhì)量評(píng)估
1. 完整性
2. 準(zhǔn)確性
3. 及時(shí)性
4. 一致性
二、如何提升數(shù)據(jù)質(zhì)量
1. 事前定義數(shù)據(jù)的監(jiān)控規(guī)則
提煉規(guī)則:梳理對(duì)應(yīng)指標(biāo)、確定對(duì)象(多表、單表、字段)、通過(guò)影響程度確定資產(chǎn)等級(jí)、質(zhì)量規(guī)則制定
2. 事中監(jiān)控和控制數(shù)據(jù)生產(chǎn)過(guò)程
- 質(zhì)量監(jiān)控和工作流無(wú)縫對(duì)接
- 支持定時(shí)調(diào)度
- 強(qiáng)弱規(guī)則控制ETL流程
- 對(duì)臟數(shù)據(jù)進(jìn)行清洗
3. 事后分析和問題跟蹤
- 郵件短信報(bào)警
- 稽核報(bào)告查詢
數(shù)據(jù)質(zhì)量報(bào)告的概覽、歷史趨勢(shì)、異常查詢、數(shù)據(jù)質(zhì)量表覆蓋率 - 問題分析
異常評(píng)估、嚴(yán)重程度、影響范圍、問題分類 - 表打分和質(zhì)量趨勢(shì)
- 報(bào)警問題跟蹤處理
參考博文
總結(jié)
- 上一篇: php工资条发放源码,如何通过邮箱批量单
- 下一篇: 教你一步步实现一个虚拟摇杆