大数据理论
大數(shù)據(jù)(巨量數(shù)據(jù)集合)
? ? ? ? 指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
? ? ? ? 在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時(shí)代》?[2]??中大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。大數(shù)據(jù)的5V特點(diǎn)(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性)。
?最小的基本單位是bit,按順序給出所有單位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。
特征
容量(Volume):數(shù)據(jù)的大小決定所考慮的數(shù)據(jù)的價(jià)值和潛在的信息 種類(Variety):數(shù)據(jù)類型的多樣性 速度(Velocity):指獲得數(shù)據(jù)的速度; 可變性(Variability):妨礙了處理和有效地管理數(shù)據(jù)的過程。? 真實(shí)性(Veracity):數(shù)據(jù)的質(zhì)量? 復(fù)雜性(Complexity):數(shù)據(jù)量巨大,來源多渠道 價(jià)值(value):合理運(yùn)用大數(shù)據(jù),以低成本創(chuàng)造高價(jià)值趨勢
趨勢一:數(shù)據(jù)的資源化趨勢二:與云計(jì)算的深度結(jié)合趨勢三:科學(xué)理論的突破趨勢四:數(shù)據(jù)科學(xué)和數(shù)據(jù)聯(lián)盟的成立趨勢五:數(shù)據(jù)泄露泛濫趨勢六:數(shù)據(jù)管理成為核心競爭力趨勢七:數(shù)據(jù)質(zhì)量是BI(商業(yè)智能)成功的關(guān)鍵趨勢八:數(shù)據(jù)生態(tài)系統(tǒng)復(fù)合化程度加強(qiáng)總結(jié)
- 上一篇: AXI学习记录
- 下一篇: Bugku WEB decrypt