日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据流被污染?数据质量不高?蚂蚁金服数据资产管理平台了解一下

發(fā)布時(shí)間:2024/8/23 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据流被污染?数据质量不高?蚂蚁金服数据资产管理平台了解一下 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

今年年初,螞蟻金服ATEC城市峰會(huì)在上海舉辦。金融智能專場分論壇上,螞蟻金服數(shù)據(jù)平臺部高級數(shù)據(jù)技術(shù)專家李俊華做了主題為《螞蟻金服數(shù)據(jù)治理之?dāng)?shù)據(jù)質(zhì)量治理實(shí)踐》的精彩分享。

演講中,李俊華介紹了螞蟻金服數(shù)據(jù)架構(gòu)體系的免疫系統(tǒng)——數(shù)據(jù)質(zhì)量治理體系,此外還著重介紹了數(shù)據(jù)質(zhì)量實(shí)施的相關(guān)內(nèi)容,以及螞蟻的數(shù)據(jù)質(zhì)量治理實(shí)踐與所面對的實(shí)際挑戰(zhàn)。

螞蟻金服數(shù)據(jù)平臺部高級數(shù)據(jù)技術(shù)專家李俊華

一、數(shù)據(jù)治理概況

近年來,螞蟻金服不斷在數(shù)據(jù)架構(gòu)上進(jìn)行升級改造,其目的在于解決螞蟻所面臨的數(shù)據(jù)物理孤島問題。如今,螞蟻以及整個(gè)阿里巴巴集團(tuán)的底座都統(tǒng)一到了同一個(gè)平臺上,這樣當(dāng)實(shí)現(xiàn)第五代數(shù)據(jù)架構(gòu)體系升級時(shí),就降低了一站式研發(fā)的整體門檻,并使得螞蟻金服的所有工程師都可以在平臺上輕松玩轉(zhuǎn)數(shù)據(jù)。如今,在螞蟻的數(shù)據(jù)架構(gòu)中已經(jīng)能夠很好地解決數(shù)據(jù)孤島問題,而如今在數(shù)據(jù)治理體系中所需要關(guān)注的就是邏輯的孤島。

在對數(shù)據(jù)治理展開論述之前,先談一談數(shù)據(jù)價(jià)值。

之前的情況是,當(dāng)數(shù)據(jù)首先需要經(jīng)過專門團(tuán)隊(duì)負(fù)責(zé)處理,刪除沒有價(jià)值的數(shù)據(jù),負(fù)責(zé)上線或者下線數(shù)據(jù)。但是,對于數(shù)據(jù)價(jià)值的判斷也是一個(gè)非常令人頭疼的問題,大部分的數(shù)據(jù)只會(huì)上線不會(huì)下線,這樣就造成了大量沒有價(jià)值的數(shù)據(jù)的堆積。而如今,螞蟻不僅關(guān)心下線沒有價(jià)值的數(shù)據(jù),同時(shí)也側(cè)重?cái)?shù)據(jù)資產(chǎn)的價(jià)值最大化。

在數(shù)據(jù)價(jià)值方面,螞蟻有一套完整的數(shù)據(jù)資產(chǎn)等級以及數(shù)據(jù)資產(chǎn)的易用模型,這樣就能夠驅(qū)動(dòng)自身充分利用數(shù)據(jù)資產(chǎn),來創(chuàng)造更多的價(jià)值。但是如果這些數(shù)據(jù)被使用了,但是質(zhì)量卻很低,這樣就會(huì)使得數(shù)據(jù)資產(chǎn)的價(jià)值大打折扣。

數(shù)據(jù)質(zhì)量產(chǎn)生分析

接下來將重點(diǎn)介紹螞蟻金服在數(shù)據(jù)治理質(zhì)量領(lǐng)域的實(shí)踐思路和方案,并與大家分享兩個(gè)案例。如下圖所示的是抽象數(shù)據(jù)抽取的全流程圖。

當(dāng)某個(gè)業(yè)務(wù)同學(xué)錄入數(shù)據(jù)的時(shí)候出現(xiàn)一點(diǎn)錯(cuò)誤,就會(huì)造成數(shù)據(jù)的質(zhì)量問題,比如把客戶的行業(yè)信息填錯(cuò)或者打錯(cuò)了一個(gè)字都會(huì)造成數(shù)據(jù)質(zhì)量問題,而這樣的問題很容易出現(xiàn)。

在基于傳統(tǒng)數(shù)據(jù)庫資產(chǎn)開發(fā)數(shù)據(jù)應(yīng)用的時(shí)候,基本都是從數(shù)據(jù)源端產(chǎn)數(shù)據(jù)過來,經(jīng)過加工、分析再將數(shù)據(jù)發(fā)送出去,也就是“從業(yè)務(wù)中來,最后回到業(yè)務(wù)中去”。現(xiàn)在的方案與之前存在很大區(qū)別,以前做數(shù)據(jù)處理時(shí),從數(shù)據(jù)生產(chǎn)的采集數(shù)據(jù)來,加工之后就給出去了,而如今螞蟻很多數(shù)據(jù)應(yīng)用將數(shù)據(jù)處理之后還會(huì)回到數(shù)據(jù)系統(tǒng)中。比如芝麻信用分的計(jì)算中存在很多大家看不到的場景,這些數(shù)據(jù)處理之后還會(huì)回到系統(tǒng)之中,而這個(gè)過程中每個(gè)環(huán)節(jié)都可能存在數(shù)據(jù)質(zhì)量問題。

二、數(shù)據(jù)質(zhì)量治理的挑戰(zhàn)

在下圖中的左側(cè)展示了螞蟻的業(yè)務(wù)形態(tài)。

如今,螞蟻的業(yè)務(wù)場景已經(jīng)不再僅限于統(tǒng)計(jì)分析,而在螞蟻的芝麻分、花唄、借唄以及“310”放款的背后都是數(shù)據(jù)在進(jìn)行支撐并驅(qū)動(dòng)著其發(fā)展。今天,螞蟻的業(yè)務(wù)形態(tài)成為了“技術(shù)+數(shù)據(jù)+算法”三者的融合來追求價(jià)值最大化。與此同時(shí),數(shù)據(jù)質(zhì)量治理也存在著諸多挑戰(zhàn),它們來自于業(yè)務(wù)方面、數(shù)據(jù)方面、用戶方面。

三、數(shù)據(jù)質(zhì)量治理實(shí)踐

數(shù)據(jù)質(zhì)量治理思路

從事金融業(yè)務(wù)的同學(xué)往往深有感觸,互聯(lián)網(wǎng)金融時(shí)代業(yè)務(wù)的生命周期縮短了很多,并且變化也非常頻繁,相比于原本銀行的節(jié)奏顯得非常快。

此外,目前無論是螞蟻金服還是阿里巴巴都在談“數(shù)據(jù)業(yè)務(wù)化、業(yè)務(wù)數(shù)據(jù)化”,數(shù)據(jù)和業(yè)務(wù)一同共同發(fā)展和前進(jìn),并且已經(jīng)進(jìn)入了發(fā)展的深水區(qū)。之前的幾年,螞蟻在業(yè)務(wù)上偏向于“T+1”,而如今,原來的架構(gòu)體系不足以支撐螞蟻未來繼續(xù)發(fā)展以及高時(shí)效性的訴求。同時(shí),如今螞蟻的數(shù)據(jù)體量很大,而數(shù)據(jù)業(yè)務(wù)也驅(qū)動(dòng)螞蟻的整個(gè)人才體系的升級。現(xiàn)在,除了本身做數(shù)據(jù)算法研發(fā)的同學(xué)之外,其他的技術(shù)同學(xué)也都會(huì)在平臺上使用數(shù)據(jù),這些同學(xué)可能對于數(shù)據(jù)的認(rèn)知不同,那么在數(shù)據(jù)驅(qū)動(dòng)下真正保證數(shù)據(jù)質(zhì)量就顯得異常重要。

那么如何實(shí)現(xiàn)數(shù)據(jù)質(zhì)量治理呢?

首先,需要有一套明確的組織,這是持續(xù)建設(shè)企業(yè)文化的土壤,而數(shù)據(jù)質(zhì)量治理文化的建設(shè)一定是一個(gè)確定的、有組織的并且需要長期持續(xù)推進(jìn)的事情。在組織保障和質(zhì)量文化的基礎(chǔ)之上,螞蟻還側(cè)重了研發(fā)流和數(shù)據(jù)流。在金融領(lǐng)域,研發(fā)流的管控更嚴(yán)格,也更嚴(yán)謹(jǐn)。而對于如今的互聯(lián)網(wǎng)金融而言,也需要進(jìn)行強(qiáng)管控,這是因?yàn)闃I(yè)務(wù)形態(tài)決定了研發(fā)周期很短,現(xiàn)在螞蟻在研發(fā)流做了強(qiáng)管控,在一站式數(shù)據(jù)研發(fā)平臺上,使用了分級管控。需求提出之后就會(huì)被等級管理,并且進(jìn)行打標(biāo),進(jìn)而走入不同流程。此外,研發(fā)流上還側(cè)重分級管控,在同一套標(biāo)準(zhǔn)上定義級別,拉平不同的研發(fā)流。對于數(shù)據(jù)流而言,當(dāng)一個(gè)應(yīng)用發(fā)布到生產(chǎn)環(huán)境之后,大部分精力花費(fèi)在數(shù)據(jù)流中,每天需要從生產(chǎn)環(huán)境將數(shù)據(jù)采集到處理平臺,然后運(yùn)行算法計(jì)算,之后將數(shù)據(jù)返回到生產(chǎn)環(huán)境中,走這樣的閉環(huán)。

如今,螞蟻在數(shù)據(jù)流鏈路上做了很多事情,也建設(shè)了很多能力。對于數(shù)據(jù)流而言,如果源頭被污染了,如果不能控制其污染到下游,那么越往下修復(fù)成本就越大。

基于以上的數(shù)據(jù)質(zhì)量治理思路,螞蟻金服做了很多有意思的東西,在數(shù)據(jù)平臺運(yùn)行時(shí)會(huì)將整個(gè)體系監(jiān)控起來,如果出現(xiàn)數(shù)據(jù)質(zhì)量故障,就能夠及時(shí)進(jìn)行修復(fù)。

此外,從研發(fā)到生產(chǎn)的各個(gè)環(huán)節(jié),螞蟻都做了大量的工作,這是因?yàn)榛谄脚_進(jìn)行數(shù)據(jù)研發(fā)的同學(xué)很多,需要盡量降低使用門檻。對于全數(shù)據(jù)流而言,主要建設(shè)了四大能力,包括感知能力、識別能力、智愈能力和運(yùn)營能力。

平臺需要能夠感知發(fā)布任務(wù)的故障問題以及數(shù)據(jù)質(zhì)量問題,此外,平臺需要能夠識別出潛在風(fēng)險(xiǎn),因?yàn)樾枰浅<皶r(shí)地了解被破壞的數(shù)據(jù)。當(dāng)風(fēng)險(xiǎn)被識別出來之后,就需要智愈能力,之所以使用“智”,是因?yàn)樵緮?shù)據(jù)處理任務(wù)往往是離線的,可能從凌晨開始到早上8點(diǎn)鐘左右屬于數(shù)據(jù)生產(chǎn)高峰,在這段時(shí)間里會(huì)有人員參與質(zhì)量保障任務(wù)。而智愈能力就希望通過AI算法來配合數(shù)據(jù)處理工作,使得感知能力疊加算法能力,能夠?qū)τ跀?shù)據(jù)感染進(jìn)行自愈。

最后是運(yùn)營能力,數(shù)據(jù)質(zhì)量不會(huì)被展現(xiàn)在前臺,如果數(shù)據(jù)質(zhì)量足夠好,完全可以實(shí)現(xiàn)無感知,使用者不用再擔(dān)心數(shù)據(jù)能不能用,也不會(huì)出現(xiàn)敢不敢用的疑惑,因此數(shù)據(jù)質(zhì)量對于運(yùn)營而言也非常重要。其實(shí),數(shù)據(jù)質(zhì)量問題既不僅屬于研發(fā)也不僅屬于業(yè)務(wù),而是需要全員參與,共同來解決,這就是數(shù)據(jù)治理的思路。

螞蟻數(shù)據(jù)質(zhì)量治理架構(gòu)

如下圖所示的是螞蟻金服的數(shù)據(jù)質(zhì)量治理架構(gòu)體系。

在系統(tǒng)層,按照上述所談到的具體思路,研發(fā)階段主要集中在數(shù)據(jù)測試、發(fā)布管控以及變更管理等方面的建設(shè),這里著重提及變更問題,數(shù)據(jù)的變更不僅僅設(shè)計(jì)到系統(tǒng)層的變更管理,也會(huì)涉及到在線系統(tǒng)的相互打通。如今,在線數(shù)據(jù)源的變更,也會(huì)使得數(shù)據(jù)運(yùn)營發(fā)生變更,更可能會(huì)導(dǎo)致數(shù)據(jù)運(yùn)營的數(shù)據(jù)質(zhì)量問題。

在線研發(fā)部分為數(shù)據(jù)運(yùn)營系統(tǒng)提供了一些相關(guān)的接口,能夠通知使用者線上的哪些變更會(huì)影響到數(shù)據(jù)運(yùn)營。對于發(fā)布管控能力而言,螞蟻投入了大量精力進(jìn)行研發(fā)。目前在螞蟻已經(jīng)沒有專職負(fù)責(zé)數(shù)據(jù)測試的同學(xué),基本上全部都是全棧工程師,所以對于研發(fā)而言可能管控不是非常強(qiáng),但卻實(shí)現(xiàn)了強(qiáng)大的發(fā)布管控能力,將與經(jīng)驗(yàn)、規(guī)范、性能以及質(zhì)量相關(guān)的檢測全部在這部分執(zhí)行。

在生產(chǎn)階段,則主要側(cè)重于質(zhì)量監(jiān)控、應(yīng)急演練以及質(zhì)量治理這三個(gè)系統(tǒng)能力。質(zhì)量監(jiān)控告警系統(tǒng)能力在大部分的數(shù)據(jù)系統(tǒng)架構(gòu)中應(yīng)該都有,其功能類似于汽車的剎車功能,因此肯定是存在的。而螞蟻卻做了一件很有意思的事情——數(shù)據(jù)攻防演練,工程師會(huì)人為創(chuàng)造故障,然后測試系統(tǒng)能否在短時(shí)間內(nèi)發(fā)現(xiàn)故障并進(jìn)行有效修復(fù),這部分也是目前螞蟻在重點(diǎn)進(jìn)行建設(shè)的能力。在質(zhì)量治理部分,會(huì)根據(jù)不同應(yīng)用的級別,發(fā)布到生產(chǎn)環(huán)境之后進(jìn)行定期巡檢,分析是否會(huì)影響數(shù)據(jù)質(zhì)量。總之,對于數(shù)據(jù)質(zhì)量架構(gòu)體系的系統(tǒng)層而言,不僅原數(shù)據(jù)非常重要,如今更是結(jié)合機(jī)器學(xué)習(xí)來自動(dòng)配置一些相關(guān)策略。

數(shù)據(jù)質(zhì)量治理方案

如下圖所示的是螞蟻金服在實(shí)踐中的事前、事中、事后的數(shù)據(jù)質(zhì)量質(zhì)量方案。

整體而言,事前包括需求、研發(fā)、和預(yù)發(fā)三個(gè)階段,而如今螞蟻在事前可以做到的可管控、可仿真、可灰度。在事中,監(jiān)控問題是重點(diǎn)建設(shè)的,出現(xiàn)問題不可怕,但是需要實(shí)現(xiàn)自主發(fā)現(xiàn)問題。而為了使得防御能力更強(qiáng),螞蟻實(shí)現(xiàn)了主動(dòng)的攻擊演練,而正是通過攻防演練,幫助螞蟻發(fā)現(xiàn)了自身很多薄弱的地方。除此之外,還在事中提供了強(qiáng)大的應(yīng)急能力,某些事件將會(huì)觸發(fā)應(yīng)急預(yù)案,在這部分,保證數(shù)據(jù)質(zhì)量其實(shí)就是把不確定的數(shù)據(jù)風(fēng)險(xiǎn)變成確定的東西。在事后,數(shù)據(jù)質(zhì)量也非常重要,事后需要通過有效的指標(biāo)和管控手段來進(jìn)行審計(jì)和度量,以此發(fā)現(xiàn)整個(gè)鏈路上不完善的地方并持續(xù)完善。

數(shù)據(jù)質(zhì)量治理案例

最后為大家分享螞蟻金服在數(shù)據(jù)質(zhì)量治理方面的兩個(gè)案例:

案例1:在螞蟻數(shù)據(jù)治理架構(gòu)體系下的發(fā)布環(huán)節(jié),實(shí)現(xiàn)了一個(gè)發(fā)布強(qiáng)管控的流程。任何腳本在提交時(shí)都需要經(jīng)過檢測,然后發(fā)布到線上,并再進(jìn)行一次檢測。

案例2:數(shù)據(jù)治理涉及到整個(gè)鏈路,而針對不同鏈路上的數(shù)據(jù)版本,數(shù)據(jù)采集主要是將數(shù)據(jù)從一端搬運(yùn)到另一端,不存在加工的過程,此時(shí)可以人為注入一些故障,分析數(shù)據(jù)質(zhì)量治理體系能否發(fā)現(xiàn)問題并作出修改,因此這就產(chǎn)生了“攻”與“防”雙方。數(shù)據(jù)加工處理又另外一套體系結(jié)構(gòu),其涉及邏輯的加工,更多地需要考慮注入怎樣的故障,需要面臨什么。如今,在螞蟻真正落地?cái)?shù)據(jù)質(zhì)量治理體系的時(shí)候,在攻防演練環(huán)節(jié)投入了大量精力。

#阿里云開年Hi購季#幸運(yùn)抽好禮!
點(diǎn)此抽獎(jiǎng):https://www.aliyun.com/acts/product-section-2019/yq-lottery?utm_content=g_1000042901

原文鏈接
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。

總結(jié)

以上是生活随笔為你收集整理的数据流被污染?数据质量不高?蚂蚁金服数据资产管理平台了解一下的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 精品一区二区三区欧美 | 9999免费视频 | 国产精品30p| 啪啪免费视频网站 | 欧美呦交 | 日本中文在线 | 天天想你在线观看完整版高清 | 国产码视频 | xxx色| 欧美日韩在线播放视频 | 成人影片在线免费观看 | 精品久久久久久亚洲 | 成人午夜视频在线播放 | 亚洲av第一成肉网 | 一区二区三区视频免费在线观看 | 欧美亚洲中文精品字幕 | 久热只有精品 | 国产色站 | 日本丰满少妇 | 久久婷婷影院 | 超碰c | 韩日毛片 | 午夜精品一区 | 中国男女全黄大片 | 欧美美女一区 | 久久偷看各类女兵18女厕嘘嘘 | 国产精品福利视频 | 成人深夜电影 | 瑟瑟在线观看 | 免费在线性爱视频 | zzjj国产精品一区二区 | 色在线免费观看 | a级片日本| 成人深夜网站 | 免费看三级黄色片 | 亚洲色图自拍 | 一级片久久久久 | 久久久啊啊啊 | 一级大毛片 | 日本污污网站 | 香蕉久久夜色精品国产使用方法 | 亚洲成人高清在线观看 | 久久久久国产精品一区二区 | 婷婷视频在线 | 天堂影音| 视频在线91 | 日韩视频中文 | 波多野结衣视频网址 | 18深夜在线观看免费视频 | 国产精品一区二区小说 | 天天干夜夜怕 | caopeng视频 | 奇米狠狠去啦 | 亚洲卡一 | 久久发布国产伦子伦精品 | 91精品免费看 | 中文字幕第五页 | 国产精品色呦呦 | 久久久久久一级片 | 国产91网 | 国产美女一区二区 | 凹凸日日摸日日碰夜夜 | 看片网址国产福利av中文字幕 | 成人a v视频 | 熟女俱乐部一区二区视频在线 | √8天堂资源地址中文在线 欧美精品在线一区二区 | h片在线观看网站 | 久久久久久久久久久网 | 一级黄色片网址 | 国产主播一区 | 美女尻逼视频 | 久久亚洲国产成人精品性色 | 国产专区av | 国产精品久久久久久久久久免费看 | 丁香一区二区 | 日韩视频在线观看免费 | 污视频在线观看网址 | 57pao国产成永久免费视频 | 中文字幕一区二区三区乱码在线 | 国产一区二区影院 | 日韩av在线观看免费 | 成年人免费在线观看 | 国产精品毛片一区二区三区 | www亚洲色图 | 国产妇女馒头高清泬20p多 | 少妇又色又爽又黄的视频 | 欧美国产日韩综合 | 久久久av片| 99ri国产| av噜噜在线观看 | www.99re7.com| 精品日韩在线播放 | 日本3级网站 | 国模无码一区二区三区 | 日本一二三不卡视频 | 91视频精品 | 麻豆视频在线观看免费网站 | 国产福利在线观看 | 深夜福利视频在线 |