日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据标准化方法论思考总结

發布時間:2023/12/29 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据标准化方法论思考总结 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數據標準化總結

  • 數據標準化總結
    • 元數據管理
      • 目錄式實現 VS 詞素管理
      • 應對策略
    • 數據字典方法論
      • 基本概念
      • 數據標準的小例子
      • 數據標準化實施步驟
        • 1. 標準化對象收集
        • 2. 詞素拆分
        • 3/4.標準單詞、標準用戶定義
      • 基礎數據與指標數據標準化
      • QA
    • 指標數據標準化
    • 數據治理的一些鏈接

數據標準化總結

元數據管理

目錄式實現 VS 詞素管理

目前各個公司或多或少都存在數據標準問題,英文名稱中后綴相同,中文名稱不同;英文……而且隨著業務數據的增加,數據標準問題會像滾雪球一樣越積越多。
基于越來越多的數據標準問題,目錄式管理元數據(IBM目前就是目錄式的),元數據語義層和數據模型建模的關聯很弱。
我們想,在一般的目錄式整理規范 很難將越來越多的業務數據標準化時,是否能夠找出一種新的方法將業務數據一一規范起來。

應對策略

后面,我們發現很多東西實現原子化之后就很好解決,比如,在規范業務術語時,將業務術語用詞素拆分的方式拆分成一個個原子化單詞,在一個企業中真正原子化的業務術語是非常非常少的,將這些未數不多的原子化的單詞進行定義之后,我們可以組合出更多的業務術語。

但是,要對業務數據進行統一標準化,必須制定數據字典,從標準化開始做起,在這里標準化,第一個是將業務術語分解成詞素,從詞素種提取出原子化的標準單詞。第二對單詞進行定義。一個單詞只能有一種業務含義,這樣一一對應,英文單詞也只有一個。
最后用標準單詞組成業務術語的標準名稱。

數據字典方法論

基本概念


數據標準的小例子

數據標準化實施步驟

1. 標準化對象收集

2. 詞素拆分

詞素拆分通常會在excel模板中進行,首先為參與人員講解如何判別詞素,之后由人員分工操作,分別進行詞素的拆分,之后大家分工的詞素拆分結果合并在一起進行整合,再討論和確認。

3/4.標準單詞、標準用戶定義

基礎數據與指標數據標準化

QA

  • 詞素拆分的理解,詞素拆分這樣的話有個延伸問題,詞素拆分這樣的方式是中國創造的還是來源于國外?
    詞素拆分的來源:詞素拆分的做法來源于東亞的做法。IBM在美國不拆,因為他們只用英語。 而且,對元數據的理念是不同的。IBM實現的效果是目錄式的,元數據語義層和數據模型建模的關聯很弱。
  • 詞素拆分的出發點:
    詞素拆分,以中文還是英文為基礎出發?必須以中文為基礎。
  • 詞素和標準單詞的區別
    詞素和標準單詞的區別是,標準單詞是從詞素中篩選出來的一部分。 詞素是標準化項目實施的開始階段的產物,但是得到標準單詞之后就不再需要了。
    詞素中的一部分,變成了同義詞、也就是非標準單詞;還有一部分,可以在項目中被判定永久棄用——例如一些業務對象的舊稱謂、已經從業務上永遠過時不再使用了,就可以不再去轉變為標準單詞了。 像我以前的項目中,一些老的系統還有“傳呼號碼”這樣的業務名稱,但是客戶確認之后,說傳呼以后再也不會使用了,就可以在詞素工作階段直接拋棄了。
  • 狀態在數據字典中是否可以作為一個標準用語?
    狀態是一個詞素,但是不能是一個標準用語。狀態在不同的業務里代表不同的含義,比如在考試業務里,可以表示為考試狀態(考試開始,上傳,考試結束)。比如在設備使用業務里,可以表示為使用狀態(閑置,使用中,報廢)。所以在設計表及列的時候用根據業務在狀態前加業務前綴。

指標數據標準化

數據指標體系是數倉建模的核心,也是多維分析的基礎,構建一個合理完善的指標體系,數倉才能更好的提供數據、輸出價值,使用數據指導業務的效率也會成倍提高。
指標體系就是將各類數據指標維度成體系的關聯起來,按照具體的業務板塊與業務過程,將指標按照不同的特點、屬性及維度進行分類分層。
數據指標常用于指導運營決策、評價產品業務的優劣。通過對數據指標的拆解能夠得出產品、策略、運營等各方面目前存在的問題以及優點,從而得出改進的方向。
非體系化的指標通常是單點分析,無法將更多關聯指標聯系起來做全局的分析,而體系化的指標則可以將不同的指標維度綜合起來起來進行全面的分析,會更快的發現目前產品和業務流程存在的問題。

數據治理的一些鏈接

鏈接: link.
學而思網校數據指標體系建設實踐.
【袋鼠云數據】數據中臺專欄(三):數據質量分析及提升.
數據中臺的質量管理.
l數據質量檢查.
普元數據】企業數據標準規劃、建設和應用1.
普元數據企業數據質量管理核心要素和技術原則.
普元數據數據標準在管理信息系統中的應用.
普元數據數字化轉型下的自動化大數據治理.
【物流IT圈】大數據平臺下的數據治理鏈接.

總結

以上是生活随笔為你收集整理的数据标准化方法论思考总结的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 色一区二区三区 | 午夜伦情 | 被两个男人吃奶三p爽文 | 成熟的女同志hd | 国产大片一区二区 | 美女脱裤子让男人捅 | 成年人av| 日韩在线欧美在线 | 日韩乱码人妻无码中文字幕久久 | 国产二级视频 | 中文字幕久久久 | 六月天综合网 | 国产精品99一区二区三区 | 国产免费av一区二区 | 欧美国产精品一区二区 | 亚洲一卡一卡 | 99ri视频 | 国产奶头好大揉着好爽视频 | 99久久婷婷国产一区二区三区 | 爱福利视频网 | 国产美女精品久久 | 天天天天天天干 | 打开免费观看视频在线 | 麻豆乱码国产一区二区三区 | 特大黑人巨交性xxxx | 成人福利社 | 国产精品自拍一区 | 婷婷激情五月综合 | 亚洲资源在线播放 | 午夜色综合 | 久久五月激情 | 成人黄色动漫在线观看 | 日本 在线 | 绯色av蜜臀vs少妇 | 色呦呦呦呦 | 亚洲男女网站 | 欧美亚洲黄色片 | 欧美一区二区三区激情视频 | 欧美人体视频一区二区三区 | 蜜桃91丨九色丨蝌蚪91桃色 | 99精品一级欧美片免费播放 | 日韩一级片在线观看 | 91九色pron | 无码人妻aⅴ一区二区三区日本 | 国产成人毛毛毛片 | 色欲狠狠躁天天躁无码中文字幕 | 114国产精品久久免费观看 | 伦理av在线 | 天堂一二三区 | 日本一区二区视频 | 国产美女在线播放 | 丰满大肥婆肥奶大屁股 | 日韩黄色一级视频 | 狠狠干男人的天堂 | 伊人狠狠操 | 91国偷自产一区二区三区观看 | 国产一区二区网址 | 国产麻豆午夜三级精品 | 欧美91精品 | 香蕉在线观看 | 红桃视频成人在线 | 久久精品香蕉 | 清冷学长被爆c躁到高潮失禁 | 日本伊人网 | 亚洲综合一区在线 | 自拍偷拍精品视频 | 国产原创av在线 | 人人干夜夜操 | 天天夜夜人人 | 欧美国产在线看 | 久久av无码精品人妻出轨 | 日本十大三级艳星 | 欧美日韩亚洲成人 | 人人妻人人澡人人爽人人精品 | 国产精品99无码一区二区 | 在线97| 在线中文字幕视频 | 国产精品美女主播 | 国产亚洲精品久久久久动 | 无码精品人妻一区二区 | 一区视频网站 | 亚洲国产剧情在线观看 | 中文字幕在线观看免费 | 欧美日韩免费 | 国产网站无遮挡 | 久久三区| 日韩成人一区二区 | 日本打屁股网站 | www.999热 | 手机在线看片1024 | 国产亚洲精品成人 | 日日色av | 剧情av在线 | 国产精品网站入口 | 经典杯子蛋糕日剧在线观看免费 | 91手机在线 | 日日干,夜夜操 | 国产激情av | 自拍1区 |