Data - 数据思维 - 上篇
1 - 概念與定義
如果分析思維是一種結構化思考的體現(xiàn),那么數(shù)據(jù)分析思維(簡稱數(shù)據(jù)思維)則是以數(shù)據(jù)為依托的結構化分析方式。
不同于“我覺得”、“以前是怎樣”、“其他人如何”這些直覺化、經驗化、類比化的思考方式,數(shù)據(jù)思維是以數(shù)據(jù)為導向,依據(jù)嚴格的分析、統(tǒng)計和證明來指導具體的應用與操作。
首先,要對事物本身有一個全面和客觀的認識。
- 以辯證思維來認識和看待事物,進行事物的分解和集成,全面客觀地以數(shù)據(jù)說話,同時減少主觀偏頗看法,
- 結合外部環(huán)境、時間線、核心維度,全面的分析物的行為特征或動態(tài)展現(xiàn)
- 關注事物的外在交互關系、內部結構和銜接,分析事物相關的內外環(huán)境因素
然后,確定事物本身的關鍵屬性、維度和分析評估體系。
分析事物各關鍵指標特性間的相互制約和促進力。
任何評估指標值的得出,一定有事物本身內在數(shù)據(jù)和運作機制進行支撐的,也就是說,將對事物分析后的數(shù)據(jù)映射到具體的可用的科學評價體系之上。
1.1 - 數(shù)據(jù)分析的目的
數(shù)據(jù)分析是為了能以量化的方式來分析業(yè)務問題并得出結論。
“從歷史數(shù)據(jù)中獲得的洞察轉化為可執(zhí)行的決策或推薦的過程,將IT技術、管理科學和統(tǒng)計學結合以解決實際問題。”
明確數(shù)據(jù)分析本身的目的,以終為始,也就是必須明確要解決的問題
- 問題背景
- 問題的具體含義
- 針對現(xiàn)有問題采取的行為和結果
1.2 - 數(shù)據(jù)分析的一般步驟
業(yè)務指導數(shù)據(jù),數(shù)據(jù)驅動業(yè)務。
數(shù)據(jù)分析并不是一個結果,只是過程,在這個過程中是需要反饋和持續(xù)改進的。
1.3 - 數(shù)據(jù)分析的作用
數(shù)據(jù)分析的三大作用,主要是:現(xiàn)狀分析、原因分析和預測分析。
什么時候開展什么樣的數(shù)據(jù)分析,需要根據(jù)我們的需求和目的來確定。
- 數(shù)據(jù)分析的目的越明確,分析越有價值。
- 明確目的后,需要梳理思路,搭建分析框架,把分析目的分解成若干個不同的分析要點,然后針對每個分析要點確定分析方法和具體分析指標;
- 最后,確保分析框架的體系化(體系化,即先分析什么,后分析什么,使得各個分析點之間具有邏輯聯(lián)系),使分析結果具有說服力。
1.4 - 數(shù)據(jù)常識(Data Common Sense)
對數(shù)據(jù)的變化保持敏感。
這里的“變化”不僅僅來自數(shù)值本身的變動,更多的而來自“當前的數(shù)據(jù)”不同于平常的認知和判斷。
而這種“平常的認知和判斷”,其實不僅是長期數(shù)據(jù)觀察和分析所形成的“感覺”,也是你的“經歷和經驗”,甚至是“當前的知識結構和能力樹”。
能夠認識到“變化”的來源,能有效避免掉入“主觀判斷”的陷阱。
想要培養(yǎng)出數(shù)據(jù)敏感性和具備意識數(shù)據(jù)偏離的能力,這需要保持持久的觀察和分析,以及足夠的耐心和好奇心。
業(yè)務數(shù)據(jù)對應著業(yè)務流程,業(yè)務流程暗含著業(yè)務需求,業(yè)務需求來自實際運營,從實際應用中去理解數(shù)據(jù)的產生和流動,有助于準確保持數(shù)據(jù)分析的“方向”不偏離“正軌”。
- 形成查看關注數(shù)據(jù)的習慣,明確數(shù)值含義以及合理范圍
- 牢記核心數(shù)據(jù)、指標、報告和排名等,反復推算合理性
- 抽離和規(guī)整數(shù)據(jù),統(tǒng)一存放,方便查閱和分析
2 - 搭建框架
量化是為了統(tǒng)一認知,并且確保路徑可回溯,可復制,避免“我感覺”、“我猜測”等主觀判斷。
路徑可回溯、可復制:通過量化后的結果,許多優(yōu)化的方法是可以被找到原因并且可以被復制的。
要想做到量化,需要做到三點:建立量化體系,明確量化重點和保證數(shù)據(jù)準確性。
2.1 - 建立量化體系
如果不能衡量,那么就不能有效增長和改進。
需要統(tǒng)一標準來定義和評價,這個標準就是指標。
具體的指標數(shù)值,可以避免“我覺得”造成的認知陷阱,“模糊虛妄”的描述會將人帶入歧途。
2.2 - 明確量化重點
每個階段,都應該明確當前的業(yè)務重點;量化體系需要根據(jù)業(yè)務階段,更改量化重點及方式。
這同時意味著:有更細節(jié)的指標及更大的監(jiān)控和推廣力度。
每個階段,都需要根據(jù)不同的業(yè)務情況來判斷當前重點,從而圍繞該重點建立一套無死角的分析監(jiān)控體系。
2.3 - 指標設計方法
孤立的指標發(fā)揮不出數(shù)據(jù)的價值,需要建立結構化的指標體系。
不同業(yè)務形態(tài)有不同的指標體系,沒有放之四海而皆準的模板。
指標的細分和拆解過程,其實對應著問題的拆分過程,應該根據(jù)具體的情況選擇指標,只有選擇合適的指標才能充分的反映問題。
- 以準確和易懂為準則,集合統(tǒng)計學和業(yè)務效果的方法論。
- 準確是指能夠準確滿足衡量目的,易懂是指標算法能直觀顯示好與壞,并且指標的算法也能夠通俗易懂。
- 準確是必須要保證的。
一些用于指標設計的常用統(tǒng)計學工具
- 業(yè)務概況: 平均數(shù)、中位數(shù)、眾數(shù)
- 業(yè)務差異性:方差、標準差
- 業(yè)務分布:頻數(shù)
一些Tips
- 比率指標:易于關注實際效果
- 伴生指標:防止單個“片面性指標”的副作用
- 防止壞指標:錯誤指標,虛榮指標(距離核心業(yè)務目標過遠),復雜指標(數(shù)據(jù)波動時,很難分析原因)
指標維度字典(Dimension Dictionary)
- 指標維度字典,(Bus Matrix),一定程度上解決了對于指標定義不清或不統(tǒng)一的問題。
- 可以對一些關鍵和常用的指標進行統(tǒng)一的維護。
明確指標的定義和解釋,要求制定者必須具備深入了解業(yè)務和擁有極高的抽象能力。
尋找業(yè)界已有量化方法并在組織內推廣,將是件事半功倍的事情。
2.4 - 指標區(qū)分
一個好的指標需要可量化、可測量、可以精準反饋。
只有基于對問題的了解和思考,才能發(fā)現(xiàn)有價值的結論。
“好指標”
- 不是所有的指標都是有效的,核心驅動指標才是需要重點關注的“好指標”。
- 簡單來說,核心驅動指標和組織發(fā)展相關聯(lián),是整個運營團隊、產品團隊乃至研發(fā)團隊在統(tǒng)一為之努力的目標,是一個時期/階段內的重點方向。
- 不同業(yè)務的核心驅動指標也不一樣。
- "好指標"應該是在有效基數(shù)上的比率或者比例,易于衡量和對比。
“壞指標”
- 虛榮指標:沒有任何的實際意義,能夠粉飾工作績效
- 后驗性指標:時效性差,實際上只是在描述已發(fā)生事件,很難通過措施挽回成本和彌補損失
- 復雜性指標:數(shù)據(jù)分析掉入“一堆隱藏變量指標”的陷阱中,無從下手
2.5 - 建立正確的指標結構
根據(jù)“指標設計方法”建立起圍繞業(yè)務的指標體系。
核心是根據(jù)業(yè)務特征確定核心指標,在核心指標的基礎上以不同的角度進行拆解,然后再慢慢補充其他業(yè)務的指標情況。
和分析思維的金字塔結構一樣,拆解的過程依照金字塔方法論的“逐層拆解,不重不漏(MECE)”,指標呈現(xiàn)樹狀結構,構建核心是以業(yè)務流程為思路,以結構為導向。
從流程的角度搭建指標框架,可以全面的囊括用戶相關數(shù)據(jù),無有遺漏。
列舉指標原則:需要有核心驅動指標。移除虛榮指標,適當?shù)倪M行刪減,不要為添加指標而添加指標。
若拆解出來或業(yè)務補充的指標過多,可借鑒數(shù)據(jù)倉庫的“域”概念來管理這些指標。
3 - 數(shù)據(jù)準確性
確保準確性的方法
- 采取可信來源:多來源交叉確認,采用新來源時需格外小心
- 確認加工方式:指標定義和加工算法
- Double Check:量級,計算邏輯和業(yè)務常識
Double Check 的技巧
- 量級 Check:邊界值,每個數(shù)據(jù)有它的大概范圍
- 計算邏輯 Check:總數(shù)、中位數(shù)、平均數(shù)等
- 業(yè)務常識 Check:根據(jù)其他常用數(shù)字推算出該業(yè)務范圍
數(shù)據(jù)產品已經有成熟的數(shù)據(jù)質量管理方法;涉及了數(shù)據(jù)源,指標計算和數(shù)據(jù)呈現(xiàn)等各個環(huán)節(jié)的監(jiān)控。
4 - 溝通與反饋
4.1 - 站在業(yè)務方的角度
只有解決業(yè)務問題分析才能創(chuàng)造價值,包括個人價值和公司價值。
“憂其所慮,給其所欲”:精準理解對方需求。
4.2 - 主要環(huán)節(jié)
- 溝通充分:確定業(yè)務方想要分析什么,提出更合理專業(yè)的衡量和分析方式,明確所要數(shù)據(jù)背后的含義,同時做好節(jié)點同步,切忌一條路走到黑
- 結論簡明:在闡述分析結果上,要記得結論先行,逐層講解,再提供論據(jù)。論據(jù)上,圖 > 表 > 文字
- 提供信息量及可落地建議:從專業(yè)的角度,從已知邊界向未知邊界分析,提供給對方所未知的信息和可落地的建議
- 尋求反饋:持續(xù)改進的觸發(fā)點
5 - 方式與方法
5.1 - 數(shù)據(jù)分析方法論和數(shù)據(jù)分析法的區(qū)別
數(shù)據(jù)分析方法論主要是從宏觀角度指導如何進行數(shù)據(jù)分析,就像是一個數(shù)據(jù)分析的前期規(guī)劃,指導著后期數(shù)據(jù)分析工作的開展。
- 利用維度分析數(shù)據(jù)
- 使用統(tǒng)計學知識,例如數(shù)據(jù)分布假設檢驗
- 使用機器學習
數(shù)據(jù)分析法主要從微觀角度指導如何進行數(shù)據(jù)分析,是指具體的分析方法,比如對比分析、交叉分析、相關分析、回歸分析等。
5.2 - 維度分析法
維度是描述對象的參數(shù),在具體分析中,可以把它認為是分析事物的角度。
有了維度后,就能夠通過不同的維度組合,形成數(shù)據(jù)模型,一個多維的數(shù)據(jù)立方體。
數(shù)據(jù)模型將復雜的數(shù)據(jù)以結構化的形式有序的組織起來。
數(shù)據(jù)模型可以從不同的角度和層面來觀察數(shù)據(jù),這樣提高了分析的靈活性,滿足不同的分析需求、這個過程叫做OLAP(聯(lián)機分析處理)。
5.3 - 指標和維度有什么區(qū)別?
維度是說明和觀察事物的角度,指標是衡量數(shù)據(jù)的標準。
維度是一個更大的范圍,不只是數(shù)據(jù),比如時間維度和城市維度,我們就無法用指標表示,而指標(留存率、跳出率、瀏覽時間等)卻可以成為維度。
通過業(yè)務建立和篩選出指標,將指標作為維度,利用維度進行分析,通俗理解:維度>指標。
一般來說,指標都可以作為維度使用。
轉載于:https://www.cnblogs.com/anliven/p/6834083.html
總結
以上是生活随笔為你收集整理的Data - 数据思维 - 上篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: wpf 对控件进行截图,获取快照
- 下一篇: 从零开始学Go之接口(一):接口