数据分析的3大阶段6大步骤
前言
這篇文章是我讀《成為數(shù)據(jù)分析師:6步練就數(shù)據(jù)思維》之后,進(jìn)行的一篇梳理、回顧的文章。我將對(duì)這本書中我認(rèn)為重要的知識(shí)點(diǎn)與大家分享,感興趣的小伙伴可以找這本書看看。
一、這是一本什么樣的書?
(1)書本概述
這是一本科普性質(zhì)的文章,讓我們能更好的理解數(shù)據(jù)分析的每一個(gè)過(guò)程與步驟,其中包含的大量例子能夠幫助我們很好的理解每一個(gè)步驟。書本風(fēng)格是歐美風(fēng),是國(guó)外書的譯本。
書本共分為三個(gè)模塊:
- 引言(了解)
- 主要講數(shù)據(jù)分析是什么?
- 3大階段、6大步驟,高效商業(yè)決策的秘密(重點(diǎn))
- 主要講如何進(jìn)行數(shù)據(jù)分析?
- 未來(lái)人人都是數(shù)據(jù)分析師(了解)
- 對(duì)數(shù)據(jù)分析師的工作方式以及思想進(jìn)行宣導(dǎo)
(2)適合人群
我覺得這本書適合:
- 數(shù)據(jù)分析的入門者,想要了解數(shù)據(jù)分析步驟,以及講解數(shù)據(jù)分析故事的方法。
- 已經(jīng)是數(shù)據(jù)分析師,還沒有形成自己的一套完整的數(shù)據(jù)分析項(xiàng)目的流程或步驟的,可以參考制定自己的工作流程。
書中介紹的該書的適合受眾是:
- 能基于分析結(jié)果制定出好的決策并采取行動(dòng)的人。
- 雖然是企業(yè)內(nèi)部的非定量分析人員,但需要基于定量數(shù)據(jù)和分析來(lái)開展工作并制定決策。
我對(duì)書本受眾人員的解讀就是:業(yè)務(wù)層的分析人員,需要借助技術(shù)方向的人來(lái)做決策。
二、引言部分解讀:數(shù)據(jù)分析的本質(zhì)
(1)數(shù)據(jù)分析本質(zhì)
通過(guò)對(duì)大量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、分析、解釋和挖掘,然后推動(dòng)現(xiàn)實(shí)問(wèn)題的決策和價(jià)值的實(shí)現(xiàn)。
從另一本書《從零進(jìn)階 數(shù)據(jù)分析的統(tǒng)計(jì)基礎(chǔ)中》,我讀到了更接地氣的一個(gè)定義,如下:
數(shù)據(jù)分析是指通過(guò)某種方法和技巧,對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行探索、分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律等分析結(jié)果,為特定的研究或商業(yè)目的提供參考。
(2)按分析的方法和目的分類
- 描述性分析
- 所謂的“報(bào)告”,通過(guò)報(bào)表,描述某項(xiàng)事物的特性。
- 用來(lái)表達(dá)這是一個(gè)什么情況很有效,但不能解釋某種結(jié)果發(fā)生的原因或者未來(lái)會(huì)發(fā)生的事情
- 比如:某公司2018年的月度銷售額報(bào)表,報(bào)表僅表達(dá)了一個(gè)結(jié)果,而不能解釋為什么有些月份的銷售額猛增。
- 預(yù)測(cè)性分析
- 對(duì)數(shù)據(jù)特征和變量的關(guān)系進(jìn)行描述,基于過(guò)去的數(shù)據(jù)對(duì)未來(lái)進(jìn)行預(yù)測(cè);
- 步驟一般是:先確定變量之間的聯(lián)系,然后基于這種聯(lián)系來(lái)預(yù)測(cè)另一種現(xiàn)象出現(xiàn)的可能性
- 比如:用戶看到啤酒后,順便拿上尿布的可能性
- 規(guī)范性分析
- 偏向數(shù)據(jù)挖掘,通過(guò)實(shí)驗(yàn)等方式,通過(guò)多個(gè)變量的處理,得到實(shí)驗(yàn)環(huán)境,達(dá)到預(yù)期目標(biāo)
- 在得到預(yù)期結(jié)果后,就施行實(shí)驗(yàn)環(huán)境下的條件,最終達(dá)到商業(yè)目標(biāo)。
- 比如:一件商品,在某個(gè)價(jià)格的情況下,大量顧客都會(huì)購(gòu)買,但是又要有比較高的收益,這時(shí)會(huì)進(jìn)行分析,在哪個(gè)價(jià)格區(qū)間,銷量最大,收益最高。
(3)按分析方法以及收集和分析的數(shù)據(jù)類型分類
- 定性分析(非結(jié)構(gòu)化數(shù)據(jù))
- 定性,即說(shuō)明是什么的問(wèn)題。目的是深入了解某種現(xiàn)象出現(xiàn)的根本原因和誘因。
- 是分析的最初階段,也是探索性研究的有效工具
- 是探索初期的,識(shí)別是什么的問(wèn)題的一個(gè)步驟
- 定量分析(結(jié)構(gòu)化數(shù)據(jù))
- 通過(guò)統(tǒng)計(jì)、數(shù)學(xué)或者計(jì)算的方法或方式,對(duì)現(xiàn)象進(jìn)行系統(tǒng)的實(shí)證研究。
- 屬于研究階段
- 是一個(gè)分析過(guò)程,驗(yàn)證猜想與實(shí)施的過(guò)程
(4)按照研究者的目的分類(作為了解即可,不做展開)
- 統(tǒng)計(jì)
- 預(yù)測(cè)
- 數(shù)據(jù)挖掘
- 文本挖掘
- 優(yōu)化
- 實(shí)驗(yàn)設(shè)計(jì)
三、三大階段與六大步驟
階段一:構(gòu)建問(wèn)題
1、識(shí)別問(wèn)題
2、回顧之前的發(fā)現(xiàn)
階段二:解決問(wèn)題
3、建模或選擇變量
4、收集數(shù)據(jù)
5、分析數(shù)據(jù)
階段三:傳達(dá)結(jié)果并基于結(jié)果采取行動(dòng)
6、傳達(dá)結(jié)果并基于結(jié)果采取行動(dòng)
四、步驟1解讀:識(shí)別問(wèn)題
即我們需要知道并理解要做什么?發(fā)生了什么?這樣才能知道我們下一步該做什么。
而在這個(gè)過(guò)程中,我們需要識(shí)別利益相關(guān)者是誰(shuí),明白最終是誰(shuí)拍板,就跟做項(xiàng)目一樣,你要知道你的受眾是誰(shuí),對(duì)癥下藥。
同時(shí),在構(gòu)建問(wèn)題的過(guò)程中要聚焦、了解清晰的范圍,始終貫徹一點(diǎn):你想知道什么?因?yàn)橛貌煌姆椒ǖ玫降慕Y(jié)果是不一樣的。
下面是詳細(xì)解讀:
(1)構(gòu)建問(wèn)題的來(lái)源
- 純粹的好奇,通常是基于常識(shí)或?qū)κ挛锏挠^察
- 識(shí)別問(wèn)題
- 工作相關(guān)經(jīng)驗(yàn)
- 需要制定一個(gè)決策或需要采取行動(dòng)
- 需要關(guān)注當(dāng)前存在的問(wèn)題
- 創(chuàng)建理論或者辨明現(xiàn)有理論或以往的研究
(2)利益相關(guān)者
- 找到利益相關(guān)者(一般是管理者或者決策者)
- 需要注意的問(wèn)題
- 項(xiàng)目跟誰(shuí)有關(guān)?包括需求來(lái)源、資源配備、匯報(bào)對(duì)象等等
- 是否對(duì)需要解決的問(wèn)題以及你的方案有個(gè)大概的了解?
- 是否能夠給到你進(jìn)行數(shù)據(jù)分析的必要的資源?
- 是否支持在決策過(guò)程中使用分析和數(shù)據(jù)?
- 交流方式、案例等是否與他們的思維和決策方式一致?
- 是否有計(jì)劃向利益相關(guān)者定期反饋和匯報(bào)階段成果?
- 管理分析項(xiàng)目的利益相關(guān)者
- 識(shí)別所有的利益相關(guān)者
- 記錄利益相關(guān)者的需求
- 評(píng)估和分析利益相關(guān)者的興趣或影響
- 管理相關(guān)者的預(yù)期
- 采取行動(dòng)
- 審核身份和重復(fù)步驟
(3)問(wèn)題聚焦
- 數(shù)據(jù)分析不是一次毫無(wú)目標(biāo)的實(shí)踐,需要讓業(yè)務(wù)需求方明白自己的目標(biāo)在哪兒,限定分析范圍
- 問(wèn)題不聚焦,那么分析結(jié)果也將不聚焦,結(jié)果是分散的
- 所以需要識(shí)別相關(guān)利益者,并管理利益相關(guān)者的預(yù)期,識(shí)別最終拍板行動(dòng)的人。
(4)問(wèn)題的范圍
- 問(wèn)題如果很寬泛,數(shù)據(jù)手機(jī)就會(huì)變得很困難
- 不要過(guò)早的限制問(wèn)題或決策的范圍,開放性的思考有哪些可選擇的方向
- 問(wèn)題要是一個(gè)可以檢驗(yàn)的假設(shè),即:問(wèn)題要能得出結(jié)果。
(5)關(guān)鍵在于:你想知道什么
- 在分析挖掘過(guò)程中,對(duì)事物的不同定義方法會(huì)對(duì)結(jié)果造成很大影響
- 例如:研究顧客喜歡吃什么口味薯片。
- 一位分析師讓顧客記錄下每次吃的是哪個(gè)品牌的什么口味的薯片
- 結(jié)果精準(zhǔn),但參與度低,受環(huán)境影響大
- 另一位分析師讓顧客選擇近半年經(jīng)常吃的薯片是哪個(gè)品牌的什么口味的
- 結(jié)果可能不精準(zhǔn),但參與度會(huì)高,受環(huán)境影響小
- 一位分析師讓顧客記錄下每次吃的是哪個(gè)品牌的什么口味的薯片
五、步驟2解讀:回顧之前的發(fā)現(xiàn)
有很多其他書本上,沒有寫這個(gè)步驟,沒有將其放入數(shù)據(jù)分析步驟中。但我覺得,回顧過(guò)去發(fā)現(xiàn)很有必要。
最重要的,應(yīng)該是了解當(dāng)前故事的古往今來(lái),避免踩坑,以及避免重復(fù)性工作。
(1)回顧之前的發(fā)現(xiàn),思考:
- 到目前為止這個(gè)問(wèn)題時(shí)是如何被構(gòu)建的?
- 這個(gè)問(wèn)題可能以何種不同的方式被概念化?
- 是否有不同類型的發(fā)現(xiàn)?
(2)回顧之前的發(fā)現(xiàn),可能帶來(lái):
- 能講什么樣的故事?這個(gè)故事與什么有關(guān)?
- 我們更需要什么樣的數(shù)據(jù)?
- 以前的變量是如何定義的?
- 我們更可能進(jìn)行哪種分析?
- 如何用一種與過(guò)往不同的方式來(lái)講述我們的新故事?
第一階段收尾:問(wèn)自己10個(gè)問(wèn)題來(lái)判斷自己是否真的很好的構(gòu)建了問(wèn)題
1、是否清晰的定義了一個(gè)問(wèn)題或機(jī)會(huì)來(lái)解決企業(yè)的實(shí)際問(wèn)題?
- 要分析的內(nèi)容清楚了么?
2、是否有考慮過(guò)多種方式來(lái)解決問(wèn)題?
- 選擇的方式是不是最優(yōu)的?
3、是否識(shí)別出了問(wèn)題的利益相關(guān)者,并針對(duì)這個(gè)問(wèn)題進(jìn)行過(guò)廣泛的交流?
- 問(wèn)題不是憑空捏造的,有過(guò)充分交流么?
4、是否與利益相關(guān)者產(chǎn)生共鳴,且對(duì)他們會(huì)使用問(wèn)題的結(jié)果來(lái)制定決策擁有信心?
- 你的問(wèn)題能夠帶來(lái)成果?(謎之問(wèn)題)
5、一旦問(wèn)題被解決,決策的內(nèi)容以及決策的制定者是誰(shuí)?
- 后期好收反饋
6、是否對(duì)問(wèn)題的解讀是一個(gè)由大到小的過(guò)程,最后形成了一個(gè)需要解決、需要應(yīng)用數(shù)據(jù)以及明確可能出現(xiàn)的結(jié)果的非常確切的問(wèn)題?
- 問(wèn)題是否是一個(gè)漸進(jìn)明細(xì)的問(wèn)題?
7、是否能夠描述出你想講述的分析故事的類型?
- 按照自己的故事套路進(jìn)行分析講解問(wèn)題
8、是否有人能夠協(xié)助你完成這個(gè)特定類型的分析故事?
- 找?guī)褪?#xff1f;更專業(yè)
9、是否通過(guò)查詢,了解是否有與想解決的問(wèn)題相關(guān)的之前的發(fā)現(xiàn)或經(jīng)驗(yàn)?
- 找過(guò)去經(jīng)驗(yàn),在巨人的肩膀上做事
10、是否基于之前的發(fā)現(xiàn)和所了解到的內(nèi)容,對(duì)問(wèn)題的定義進(jìn)行修正?
- 不斷修正自己所要研究的問(wèn)題
六、步驟3解讀:建模或選擇變量
這個(gè)部分描述不多,因?yàn)闀男再|(zhì)就是科普性的不會(huì)涉及技術(shù)方便,所以作為說(shuō)明內(nèi)容,篇幅不多。
建議閱讀其中的案例,了解一些案例是怎么選取變量和進(jìn)行分析的
(1)模型定義
- 某個(gè)現(xiàn)象或問(wèn)題的一種有目的性的簡(jiǎn)化呈現(xiàn)。
- “有目的性”的意思是這個(gè)模型是為解決特定問(wèn)題而專門建立的
- ”簡(jiǎn)化“是我們必須舍棄所有非必須的和無(wú)關(guān)緊要的細(xì)節(jié),并保留最重要、有效、關(guān)鍵的且會(huì)造成影響的特征。
(2)變量選取原則
- 建立模型需要使用邏輯、經(jīng)驗(yàn)和之前的發(fā)現(xiàn)來(lái)假設(shè)你的獨(dú)立變量,以及你設(shè)法預(yù)測(cè)或解釋的問(wèn)題,還有會(huì)對(duì)這個(gè)問(wèn)題產(chǎn)生影響的獨(dú)立變量。
- 即便是相當(dāng)瑣碎、高度主觀性的決策也能通過(guò)定量和建模的方式進(jìn)行分析
七、步驟4解讀:收集與測(cè)量數(shù)據(jù)
數(shù)據(jù)一般來(lái)自于企業(yè)的數(shù)據(jù)庫(kù)或者Excel,需要注意的是如何對(duì)數(shù)據(jù)進(jìn)行ETL處理,要熟悉SQL、Excel操作。
對(duì)第三步中選定的變量進(jìn)行數(shù)據(jù)獲取和收集
(1)變量的類型
- 二元變量:變量只有兩個(gè)值,即是或否,比如性別
- 分類變量:比如:眼睛的顏色,國(guó)家等
- 序變量:即排序值
- 數(shù)值(間隔和比率):即值大小。如:體重、身高等
- 可以理解為:維度和度量
八、步驟5解讀:數(shù)據(jù)分析
(1)識(shí)別出適當(dāng)?shù)哪P?#xff0c;我們需要考慮
- 需要同時(shí)分析多少變量?
- 需要得到描述性或推論性的問(wèn)題答案么?
- 在感興趣的變量中,什么樣的測(cè)量是可行的?
(2)變量數(shù)目影響模型的選擇
- 兩個(gè)數(shù)值型變量:可能是進(jìn)行相關(guān)性分析;
- 兩個(gè)或者幾個(gè)類別型變量:適合用表格方式呈現(xiàn)分析結(jié)果(維度之間的關(guān)系);
- 兩個(gè)及以上數(shù)值型數(shù)據(jù)變量:回歸分析,或稱多遠(yuǎn)線性回歸。
#關(guān)鍵的統(tǒng)計(jì)概念和方法#
(1)ANOVA:方差分析
- 是關(guān)于超過(guò)兩組的均值是否相等的統(tǒng)計(jì)檢驗(yàn)。
(2)因果關(guān)系
- 事情A(原因)和事件B(影響)之間的關(guān)系,這時(shí)事件B被認(rèn)為是事件A的結(jié)果。
- 因果關(guān)系需要滿足的三個(gè)條件:
- 原因必須在時(shí)間和空間上先于產(chǎn)生的影響
- 當(dāng)影響起作用時(shí),原因必須已經(jīng)出現(xiàn)
- 當(dāng)影響不起作用時(shí),原因必須消失
理解:先有因才有果,有果必有因,無(wú)果因不成。
(3)聚類或聚類分析
- 將具有同一特征的數(shù)據(jù)進(jìn)行分組
- 相關(guān)系數(shù):兩個(gè)變量或多個(gè)變量相互之間的關(guān)聯(lián)程度,范圍在-1~1之間
- 1:正相關(guān)
- 0:無(wú)關(guān)
- -1:負(fù)相關(guān)
相關(guān)性不代表因果性,相關(guān)性對(duì)因果關(guān)系而言是一個(gè)必要但不充分條件,即:有因果關(guān)系必然有相關(guān)性,有相關(guān)性不一定有因果關(guān)系。
(4)獨(dú)立變量
指想要預(yù)測(cè)和解釋其未知值的變量。也可稱為:被解釋變量或者反應(yīng)變量
(5)因子分析
- 一個(gè)使用了大量變量或目標(biāo)并披露它們之間的內(nèi)在聯(lián)系的統(tǒng)計(jì)程序。
- 目的:用來(lái)把大規(guī)模的變量壓縮成更小規(guī)模
- 用途:常被用來(lái)數(shù)據(jù)簡(jiǎn)化或者結(jié)構(gòu)識(shí)別。
(6)擬合度檢驗(yàn)
一個(gè)判斷樣本數(shù)據(jù)與特定的分布之間的匹配程度的統(tǒng)計(jì)檢驗(yàn)
1)假設(shè)檢驗(yàn)
-
一個(gè)用于評(píng)估關(guān)于現(xiàn)實(shí)的假設(shè)(聲明)的系統(tǒng)性方法。
-
聲明分為:
- 零假設(shè)(H0):給定的一組觀測(cè)值之間沒有顯著的差別或相關(guān)性。
- 備擇假設(shè)(Ha/H1):我們希望展示的變化或關(guān)系在數(shù)據(jù)中確實(shí)存在。
2)獨(dú)立變量
- 一個(gè)已知能夠用于幫助預(yù)測(cè)或解釋一個(gè)獨(dú)立變量的變量。
- 也可稱為:被解釋變量、預(yù)測(cè)變量或回歸量
3)ρ值
- 當(dāng)進(jìn)行一次假設(shè)檢驗(yàn)時(shí),ρ值提供了在零假設(shè)(H0)成立的情況下,數(shù)據(jù)出現(xiàn)的可能性。
- 小的ρ值表示來(lái)自H0的罕見或異常數(shù)據(jù),這時(shí)候提供了H0不成立的依據(jù),并支持備擇假設(shè)的成立
- 在假設(shè)檢驗(yàn)中,當(dāng)ρ值小于顯著性水平α?xí)r,我們“拒絕零假設(shè)”,它通常為0.05或者0.01。
- 當(dāng)零假設(shè)被拒絕是,結(jié)果被稱為統(tǒng)計(jì)上的顯著
4)回歸
任何尋求一個(gè)預(yù)測(cè)公式的統(tǒng)計(jì)方法,這個(gè)公式允許一個(gè)獨(dú)立變量的未知值由來(lái)自一個(gè)或多個(gè)獨(dú)立變量的已知值來(lái)確定。
- 簡(jiǎn)單回歸分析
- 使用一個(gè)獨(dú)立變量來(lái)預(yù)測(cè)一個(gè)因變量
- 多元回歸分析
- 使用多元獨(dú)立變量來(lái)預(yù)測(cè)一個(gè)因變量。
- 邏輯回歸分析
- 使用多元獨(dú)立變量來(lái)預(yù)測(cè)一個(gè)二元的、絕對(duì)的獨(dú)立變量(如:購(gòu)買/不夠買、對(duì)/錯(cuò))
5)決定系數(shù)(R^2)
- 最常用的用于測(cè)量一條回歸線擬合它所基于的樣本數(shù)據(jù)程度的方法
- 數(shù)值在:0-1之間
- 它的值越大,模型就越好。說(shuō)明擬合程度越好
6)顯著性水平(α)
- 當(dāng)零假設(shè)成立時(shí),在所有可能的樣本結(jié)果中,足夠異常來(lái)拒絕零假設(shè)的結(jié)果的(任意的)最大比例被稱為顯著性水平。
- 即:顯著性水平表示認(rèn)可一個(gè)事件不可能是偶然發(fā)生所需的證據(jù)量
傳統(tǒng)的顯著性水平是5%(0.05),顯著性水平的值為5%意味著我們需要來(lái)自H0(如果H0確實(shí)是成立的)的低于5%的概率下會(huì)發(fā)生的數(shù)據(jù),來(lái)懷疑H0的正確性并拒絕承認(rèn)H0成立。
在需要提供更強(qiáng)有力的證據(jù)來(lái)接受備擇假設(shè)(比如α=1%[0.01])的情況下,我們可以使用更嚴(yán)格的顯著性水平的值。
在實(shí)踐中,顯著性水平通常通過(guò)計(jì)算ρ值來(lái)判斷;小于α的ρ值意味著拒絕H0并支持備擇假設(shè)。
7)t檢驗(yàn)
指檢驗(yàn)兩組數(shù)據(jù)的均值是否相等,或者一組數(shù)據(jù)的均值是否有一個(gè)特定的值的統(tǒng)計(jì)性檢驗(yàn)。
- 一類錯(cuò)誤或α錯(cuò)誤
- 當(dāng)零假設(shè)成立時(shí),一類錯(cuò)誤或α錯(cuò)誤出現(xiàn),但是錯(cuò)誤被拒絕。在傳統(tǒng)的假設(shè)檢驗(yàn)中,如果ρ值比顯著性水平α小時(shí),那么人們拒絕零假設(shè)。不正確地拒絕一個(gè)正確的零假設(shè)的概率等于α,因此,這個(gè)錯(cuò)誤也被稱為α錯(cuò)誤。
- Ⅰ型錯(cuò)誤,拒絕了實(shí)際上成立的H0 ,即錯(cuò)誤地判為有差別,
- 這種棄真的錯(cuò)誤稱為Ⅰ型錯(cuò)誤。其概率大小用即檢驗(yàn)水準(zhǔn)用α表示。α可取單尾也可取雙尾。假設(shè)檢驗(yàn)時(shí)可根據(jù)研究目的來(lái)確定其大小,一般取0.05或者0.01,當(dāng)拒絕H0時(shí)則理論上理論100次檢驗(yàn)中平均有5次或者1次發(fā)生這樣的錯(cuò)誤。
- 二類錯(cuò)誤或β錯(cuò)誤
- Ⅱ型錯(cuò)誤,接受了實(shí)際上不成立的H0 ,也就是錯(cuò)誤地判為無(wú)差別,這類取偽的錯(cuò)誤稱為第二類錯(cuò)誤。
- 第二類錯(cuò)誤的概率用β表示,β的大小很難確切估計(jì)。當(dāng)樣本例數(shù)固定時(shí),α愈小,β愈大;反之,α愈大,β愈小。因而可通過(guò)選定α控制β大小。要同時(shí)減小α和β,唯有增加樣本例數(shù)。
- 統(tǒng)計(jì)上將1-β稱為檢驗(yàn)效能或把握度(power of a test),即兩個(gè)總體確有差別存在,而以α為檢驗(yàn)水準(zhǔn),假設(shè)檢驗(yàn)?zāi)馨l(fā)現(xiàn)它們有差別的能力。
統(tǒng)計(jì)學(xué)上差別顯著與否,與實(shí)際意義是有區(qū)別的。
如應(yīng)用某藥治療高血壓,平均降低舒張壓0.5kPa,并得出差別有高度統(tǒng)計(jì)學(xué)意義的結(jié)論。從統(tǒng)計(jì)學(xué)角度,說(shuō)明該藥有降壓作用,但實(shí)際上,降低0.5kPa是無(wú)臨床意義。
因此要結(jié)合專業(yè)作出恰如其分的結(jié)論。
(7)模型的修正
所有應(yīng)用了定量模型的分析,必須定期檢查模型,確保他們?nèi)匀贿m用并仍然擬合數(shù)據(jù)。
如果不再適用,那就需要對(duì)模型進(jìn)行一些必要的改變。
至少每年進(jìn)行一次檢查,除非有理由需要更加頻繁的進(jìn)行檢查。
九、步驟6解讀:傳達(dá)結(jié)果并基于結(jié)果采取行動(dòng)
好故事該有的特征:
(1)在設(shè)計(jì)好故事的中間部分之前想好出結(jié)尾。
- 分析結(jié)果是講述故事的唯一原因
- 要想清楚自己希望聽眾知道寫什么?
- 要清楚你希望他們做什么?
用以上三點(diǎn)來(lái)檢測(cè)要講的故事的其他部分,只留下能支持你結(jié)尾的內(nèi)容。
(2)把結(jié)果進(jìn)行記錄,并付出行動(dòng)
一個(gè)再好的分析,沒有進(jìn)行實(shí)踐那也是白費(fèi)。
(3)能用3-5句話講述故事的基本要點(diǎn)
用最簡(jiǎn)單的方式,告訴大家你發(fā)現(xiàn)了什么。
#講述分析結(jié)果故事的方法#
(1)犯罪現(xiàn)場(chǎng)調(diào)查故事
將出現(xiàn)的問(wèn)題作為“犯罪現(xiàn)場(chǎng)”,并尋找出現(xiàn)問(wèn)題的本質(zhì)、解決辦法
例如:銷售額降低了(犯罪現(xiàn)場(chǎng)),這是為什么(找本質(zhì)和解決辦法)?
(2)尤卡里故事
犯罪現(xiàn)場(chǎng)調(diào)查故事類似
不同之處:是一種解決特定問(wèn)題和目的的方法,用來(lái)檢驗(yàn)組織戰(zhàn)略或商業(yè)模式中進(jìn)行的重大改變。(決定進(jìn)行某種決策,會(huì)帶來(lái)什么問(wèn)題)
例如:點(diǎn)外賣的時(shí)候,有些店鋪強(qiáng)制性要求購(gòu)買1元的延時(shí)服務(wù),那么現(xiàn)在店鋪打算取消強(qiáng)制購(gòu)買話,接單量是否會(huì)提升?
(3)瘋狂科學(xué)家故事
即通過(guò)實(shí)驗(yàn)進(jìn)行證明結(jié)論
比較適合零售或者銀行,對(duì)小范圍的人群進(jìn)行實(shí)驗(yàn),分為測(cè)試組和對(duì)照組,研究?jī)山M實(shí)驗(yàn)結(jié)果的顯著性(即A/B Test)
例如:作為寶潔公司的主管,我把商品放在沃爾瑪買,和放在普通超市買,沃爾瑪能賣掉更多商品么?
(4)調(diào)查故事
在已發(fā)生現(xiàn)象的基礎(chǔ)上,進(jìn)行觀察、編碼、分析。
類似于調(diào)查問(wèn)卷的形式進(jìn)行,然后針對(duì)調(diào)查所得結(jié)果進(jìn)行分析,(分析師不會(huì)試圖控制結(jié)果)
例如:在一次問(wèn)卷調(diào)查中,樣本容量為100,隨機(jī)進(jìn)行調(diào)查,分析在18-25歲之間,人們的學(xué)歷水平如何?
(5)預(yù)測(cè)故事
預(yù)測(cè)未來(lái)會(huì)發(fā)生什么的一種故事
通過(guò)對(duì)過(guò)往數(shù)據(jù)的分析和理解,發(fā)現(xiàn)導(dǎo)致過(guò)去某種現(xiàn)象發(fā)生的原因,進(jìn)而調(diào)整策略達(dá)到某種商業(yè)目的的分析
例如:調(diào)查哪有在職超過(guò)6個(gè)月,沒有實(shí)際項(xiàng)目成員將會(huì)在未來(lái)3個(gè)月離職?
(6)“情況是這樣的”故事
最常見的,僅僅使用數(shù)據(jù)說(shuō)明發(fā)生了什么的故事
即講述一個(gè)事實(shí),不會(huì)用復(fù)雜的數(shù)學(xué)計(jì)算。
比如:公司2019年第一季度的財(cái)報(bào)
十、總結(jié)
全文通讀下來(lái),我的收獲如下:
1、數(shù)據(jù)分析的3大階段6大步驟,在書中的示例中有了深刻的理解;
再次重復(fù)3大階段6大步驟:
(1)構(gòu)建問(wèn)題:
- 識(shí)別和構(gòu)建問(wèn)題
- 回顧之前的發(fā)現(xiàn)
(2)解決問(wèn)題
- 建模或選擇變量
- 收集數(shù)據(jù)
- 分析數(shù)據(jù)
(3)傳達(dá)結(jié)果并基于結(jié)果采取行動(dòng)
- 傳達(dá)結(jié)果并基于結(jié)果采取行動(dòng)
2、了解了在數(shù)據(jù)分析過(guò)程中的注意事項(xiàng),如
- 利益相關(guān)者的識(shí)別與管理;
- 如何判斷自己真的做好了問(wèn)題構(gòu)建;
- 有哪些故事?如何講故事;
3、自己覺得可以精讀地方
- 文章中關(guān)于數(shù)據(jù)分析的舉例;
- 關(guān)鍵的統(tǒng)計(jì)概念和方法;
4、初步構(gòu)建了自己的數(shù)據(jù)分析項(xiàng)目的處理套路與做事方法。
結(jié)語(yǔ)
每本書關(guān)于數(shù)據(jù)分析步驟的描述可能都會(huì)不一樣, 但基本大同小異,我也會(huì)持續(xù)優(yōu)化我的文章。
附上,關(guān)于整篇文章的腦圖:
以上就是我對(duì)該書的理解和梳理,若有錯(cuò)誤之處,歡迎大家評(píng)論指正。
在學(xué)習(xí)數(shù)據(jù)分析的小伙伴們可以私信我,一起討論交流呀!
也歡迎大家關(guān)注我的知乎專欄《數(shù)據(jù)分析學(xué)習(xí)之路》,我將持續(xù)更新我數(shù)據(jù)分析學(xué)習(xí)之路的點(diǎn)點(diǎn)滴滴,與大家共同進(jìn)步。謝謝大家!
總結(jié)
以上是生活随笔為你收集整理的数据分析的3大阶段6大步骤的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: SQLServer数据库,表内存,实例名
- 下一篇: java业务层怎么设计_java – 在