【ACP】阿里云ACP吐血汇总(一)
文章目錄
- 一、大數(shù)據(jù)基礎(chǔ)知識(shí)小結(jié)
- (1)數(shù)據(jù)分析
- (2)數(shù)據(jù)倉庫系統(tǒng)
- (3)數(shù)據(jù)倉庫解決的問題
- (4)大數(shù)據(jù)的理解
- 二、阿里云大數(shù)據(jù)產(chǎn)品體系
- (1)產(chǎn)品體系概況:
- (2)阿里云數(shù)加平臺(tái)定位:
- (3)阿里云大數(shù)據(jù)基礎(chǔ)產(chǎn)品:
- (4)阿里云數(shù)加平臺(tái):
- 三、大數(shù)據(jù)產(chǎn)品典型應(yīng)用場景
- (1)從業(yè)務(wù)系統(tǒng)到數(shù)據(jù)分析
- (2)傳統(tǒng)企業(yè)BI應(yīng)用
- (3)探索式分析
- (4)商業(yè)智能分析
- (5)線上線下混合運(yùn)用
一、大數(shù)據(jù)基礎(chǔ)知識(shí)小結(jié)
(1)數(shù)據(jù)分析
數(shù)據(jù)分析是基于商業(yè)目的,有目的的進(jìn)行收集、整理、加工和分析數(shù)據(jù),提煉有價(jià)值信息的過程。數(shù)據(jù)分析通俗的說就是對(duì)收集起來的大量數(shù)據(jù)進(jìn)行分析,提取有用的信息。
- 數(shù)據(jù)分析流程:
需求分析 明確目標(biāo) --》 數(shù)據(jù)收集 加工處理 --》數(shù)據(jù)分析 數(shù)據(jù)展現(xiàn) --》分析報(bào)告 提煉價(jià)值
(2)數(shù)據(jù)倉庫系統(tǒng)
分析的前提是要有相應(yīng)的數(shù)據(jù),大量的業(yè)務(wù)數(shù)據(jù)聚集在一起,就產(chǎn)生了一種新的概念:數(shù)據(jù)倉庫
數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、非易失的、時(shí)變的數(shù)據(jù)集合,用于支持管理決策。
比如說一個(gè)電商系統(tǒng),他的數(shù)據(jù)可以劃分為客戶主題、產(chǎn)品主題、訂購主題、物流主題的相關(guān)數(shù)據(jù)。一個(gè)數(shù)據(jù)倉庫的數(shù)據(jù)源可以來自于不同的業(yè)務(wù)系統(tǒng),集成到同一個(gè)數(shù)據(jù)倉庫中。數(shù)據(jù)到達(dá)數(shù)據(jù)倉庫之后,會(huì)對(duì)外進(jìn)行相關(guān)的查詢,很少做相關(guān)的修改。同時(shí)數(shù)倉中的數(shù)據(jù)會(huì)隨著時(shí)間而不停地變化。
- 基于數(shù)據(jù)倉庫的數(shù)據(jù)分析流程:
分析需求–》 確認(rèn)數(shù)據(jù)源–》 ETL處理 --》匯總/整合 --》 數(shù)據(jù)建模 --》 分析展現(xiàn)
(3)數(shù)據(jù)倉庫解決的問題
- 為業(yè)務(wù)部門提供準(zhǔn)確及時(shí)的業(yè)務(wù)報(bào)表:多個(gè)業(yè)務(wù)平臺(tái)捕獲數(shù)據(jù)整合
- 為管理人員提供更強(qiáng)的分析能力
- 為數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)奠定基礎(chǔ):通過數(shù)據(jù)分析,利用數(shù)據(jù)挖掘的技術(shù)找到數(shù)據(jù)發(fā)展的模式與規(guī)律,可以使預(yù)測分析的結(jié)果更準(zhǔn)確完整。
(4)大數(shù)據(jù)的理解
大數(shù)據(jù)指在可承受的時(shí)間范圍內(nèi)用常用的軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
大數(shù)據(jù)的特點(diǎn):
- 體量巨大 體量達(dá)到 pb tb級(jí)別
- 種類繁多 數(shù)據(jù)來源于多個(gè)數(shù)據(jù)源,格式也可能是涵蓋了音頻、視頻、文本等格式
- 價(jià)值密度低
- 處理速度快 涉及相關(guān)的實(shí)時(shí)性處理
大數(shù)據(jù)的理解:
- 不能盲目追求體量
- 不能盲目追求數(shù)量
- 不能盲目追求技術(shù)
- 不能盲目追求潮流
大數(shù)據(jù)的處理思路:
- 減治:將問題簡化成一個(gè)更簡單的能處理的問題
- 分治:將問題分成多個(gè)可以簡單求解的小問題
– 復(fù)雜的問題簡單化,復(fù)雜的問題拆分化,再重復(fù)減化。
二、阿里云大數(shù)據(jù)產(chǎn)品體系
(1)產(chǎn)品體系概況:
(2)阿里云數(shù)加平臺(tái)定位:
一站式數(shù)據(jù)平臺(tái)、提供三層服務(wù)(數(shù)加平臺(tái)內(nèi)底層數(shù)加平臺(tái)提供基礎(chǔ)計(jì)算服務(wù):離線計(jì)算、流計(jì)算、分析型數(shù)據(jù)庫等,同時(shí)提供數(shù)據(jù)平臺(tái)分析工具,最上層數(shù)加平臺(tái)提供應(yīng)用級(jí)別的服務(wù),包括規(guī)則引擎、畫像分析、智能推薦) 、定制化行業(yè)解決方案。
(3)阿里云大數(shù)據(jù)基礎(chǔ)產(chǎn)品:
- 云數(shù)據(jù)庫 ApsaraDB for RDS (簡稱RDS):穩(wěn)定可靠地伸縮性在線數(shù)據(jù)庫服務(wù)、兼容 Mysql 、SQL server、PG等,只需在選擇數(shù)據(jù)庫時(shí)選擇對(duì)應(yīng)的數(shù)據(jù)庫類型和版本。
- 表格存儲(chǔ) TS:構(gòu)建在阿里云飛天分布式系統(tǒng)之上的NoSQL數(shù)據(jù)存儲(chǔ)服務(wù)。
- 分析型數(shù)據(jù)庫 Analytic DB:海量數(shù)據(jù)實(shí)時(shí)高并發(fā)在線分析云計(jì)算服務(wù)。
- 大數(shù)據(jù)計(jì)算服務(wù) MaxCompute 原名ODPS:針對(duì) TB/PB級(jí)、實(shí)時(shí)性要求不高的分布式處理能力,用于大數(shù)據(jù)運(yùn)算能力相關(guān)的服務(wù),開箱即用。
- 數(shù)據(jù)集成 Data Integration:阿里云對(duì)外提供的穩(wěn)定高效、彈性伸縮的數(shù)據(jù)同步平臺(tái),為阿里云大數(shù)據(jù)計(jì)算引擎提供離線(批量)數(shù)據(jù)進(jìn)出通道。
- 對(duì)象存儲(chǔ)服務(wù) Object Storage Service(OSS):海量、安全、低成本、高可用的云存儲(chǔ)服務(wù)。即開即用,無限大空間的存儲(chǔ)集群。
(4)阿里云數(shù)加平臺(tái):
- 大數(shù)據(jù)開發(fā)平臺(tái) DataWorks(原名Data IDE):數(shù)據(jù)工場DataWorks是基于MaxCompute作為計(jì)算和存儲(chǔ)引擎的用于工作流可視化開發(fā)和托管調(diào)度運(yùn)維的海量數(shù)據(jù)離線加工分析平臺(tái)。具有托管和調(diào)度的能力。
- Quick BI :海量數(shù)據(jù)實(shí)時(shí)在線分析服務(wù)。
- 阿里云機(jī)器學(xué)習(xí)PAI:基于MaxCompute、GPU集群,支持MR、MPI、SQL、Spark。
- DataV:大屏開發(fā)平臺(tái)。
三、大數(shù)據(jù)產(chǎn)品典型應(yīng)用場景
(1)從業(yè)務(wù)系統(tǒng)到數(shù)據(jù)分析
(2)傳統(tǒng)企業(yè)BI應(yīng)用
(3)探索式分析
(4)商業(yè)智能分析
(5)線上線下混合運(yùn)用
總結(jié)
以上是生活随笔為你收集整理的【ACP】阿里云ACP吐血汇总(一)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里巴巴副总裁肖力:云原生安全下看企业新
- 下一篇: 虚拟机Vmware玩游戏运行卡顿还有慢的