BIETLOLTP之概念熟悉
最近在了解BI方面知識,因為主要關(guān)注與數(shù)據(jù)倉庫方面,有關(guān)基本概念先學(xué)習(xí)下:)
BI
確切地講,BI并不是一項新技術(shù),它將數(shù)據(jù)倉庫(DW)、聯(lián)機分析處理(OLAP)、數(shù)據(jù)挖掘(DM)等技術(shù)與客戶關(guān)系管理(CRM)等結(jié)合起來
應(yīng)用于商業(yè)活動實際過程當(dāng)中,實現(xiàn)了技術(shù)服務(wù)于決策的目的;Mark
Hammond從管理的角度看待BI,認(rèn)為BI是從“根本上幫助你把公司的運營數(shù)據(jù)轉(zhuǎn)化成為高價值的可以獲取的信息(或者知識),并且在恰當(dāng)?shù)臅r間通過恰
當(dāng)?shù)氖侄伟亚‘?dāng)?shù)男畔鬟f給恰當(dāng)?shù)娜恕薄?
ETL
ETL即數(shù)據(jù)抽取(Extract)、轉(zhuǎn)換(Transform)、裝載(Load)的過程。它是構(gòu)建數(shù)據(jù)倉庫的重要環(huán)節(jié)。數(shù)據(jù)倉庫是面向主題
的、集成的、穩(wěn)定的且隨時間不斷變化的數(shù)據(jù)集合,用以支持經(jīng)營管理中的決策制定過程。數(shù)據(jù)倉庫系統(tǒng)中有可能存在著大量的噪聲數(shù)據(jù),引起的主要原因有:濫用
縮寫詞、慣用語、數(shù)據(jù)輸入錯誤、重復(fù)記錄、丟失值、拼寫變化等。即便是一個設(shè)計和規(guī)劃良好的數(shù)據(jù)庫系統(tǒng),如果其中存在著大量的噪聲數(shù)據(jù),那么這個系統(tǒng)也是
沒有任何意義的,因為“垃圾進,垃圾出”(garbage in, garbage
out),系統(tǒng)根本就不可能為決策分析系統(tǒng)提供任何支持。為了清除噪聲數(shù)據(jù),必須在數(shù)據(jù)庫系統(tǒng)中進行數(shù)據(jù)清洗。目前有不少數(shù)據(jù)清洗研究和ETL研究,但是
如何在ETL過程中進行有效的數(shù)據(jù)清洗并使這個過程可視化,此方面研究不多。
聯(lián)機事務(wù)處理OLTP
聯(lián)機分析處理 (OLAP)
的概念最早是由關(guān)系數(shù)據(jù)庫之父E.F.Codd于1993年提出的,他同時提出了關(guān)于OLAP的12條準(zhǔn)則。OLAP的提出引起了很大的反響,OLAP作為一類產(chǎn)品同聯(lián)機事務(wù)處理
(OLTP) 明顯區(qū)分開來。
當(dāng)今的數(shù)據(jù)處理大致可以分成兩大類:聯(lián)機事務(wù)處理OLTP(on-line transaction
processing)、聯(lián)機分析處理OLAP(On-Line Analytical
Processing)。OLTP是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng)用,主要是基本的、日常的事務(wù)處理,例如銀行交易。OLAP是數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支
持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查詢結(jié)果。
OLAP是使分析人員、管理人員或執(zhí)行人員能夠從多角度對信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。OLAP的目標(biāo)是滿足決策支持或者滿足在多維環(huán)境下特定的查詢和報表需求,它的技術(shù)核心是"維"這個概念。?
轉(zhuǎn)載于:https://www.cnblogs.com/Ronger/archive/2012/06/20/2556221.html
總結(jié)
以上是生活随笔為你收集整理的BIETLOLTP之概念熟悉的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Fusioncharts图表组件在宿舍评
- 下一篇: Unity3D 自定义数据格式