数据分析的结构体系
大數據從幾年前的概念演變為現在是落地數據,越來越多的人感受的數據的價值,目前全國各大高校同樣陸續開設數據科學與大數據專業,企業也已開展招聘數據分析相關的職位。
之前想成為數據分析師的人大致有三類:
第一類是非計算機專業的在校生,不知道怎么回事,反正就是對數據感興趣了,然后想畢業之后從事相關工作,但對職位要求、該做什么準備一無所知,處于懵懂期;
第二類是互聯網公司的產品經理和運營經理,及少數的市場經理。這些人在實際工作中,發現確實數據很有用,但對自己的數據分析能力感到不滿意,進而想做出提升;
第三類是傳統企業的業務人員,也是不知道怎么就對數據感興趣了,想要從事數據分析相關的崗位,但缺少時間系統學習,工作經歷又不足以支撐自己跳到數據分析職位。
?
而現如今隨著互聯網大數據應用的廣泛展開,越來越多的企業、政府機構等開始設立數據相關的角色以及職責。
圍繞數據分析工作,也劃分了幾類職責區域。從平臺建設線上,包括:
數據平臺工程師:負責數據平臺的研發,牽涉到從數據采集到分析的相關組件開發。
數據挖掘工程師:利用機器學習/數據挖掘相關技術,研發算法模型,用于個性化推薦、用戶畫像、精準廣告等。
數據產品經理:把數據相關的需求抽象為數據平臺的功能產品。
從數據流向的角度,包括:
ETL 工程師:把工程團隊的模塊產生的數據,不管是日志、數據表,還是埋點的數據,進行清洗、轉換,建模成利于數據分析的數據。ETL 是 Extract – Transform – Load 的縮寫。
數據分析師:利用 ETL 工程師處理好的數據,滿足業務人員的數據需求。
業務人員:產品、運營、市場、管理層等,因為產品改進、運營活動、商業決策等,有數據需求。
數據分析師的基本要求
對數據感興趣:是不是看到一行行的數字就頭大,選擇直接跳過?還是愿意花些時間研究這些數字背后意味著什么?如果你看蘋果的發布會的話,會看到喬布斯的幻燈片里出現最多的就是數字,賣了多少部,分了多少錢,厚度減少到多少毫米之類的,他相信數字簡單明了。
如果對數據不感興趣,這個角色一定不適合你。
良好的理解和抽象能力:把業務人員說的只言片語,抽象為明確的數據需求,清楚怎么從基礎數據中實現出來。還有把一些重復性的需求,抽象出模式來,用機器來替代。
良好的表達能力:數據分析師有個天然的優勢,能夠直接和老板打交道,這就要求你能站在老板的層面來表達。把一堆堆的數據,很好的呈現給業務人員,幫助他們做出正確的決策。
快速動手能力:業務人員提的數據需求,巴不得下一秒都拿到。
數據分析的專業能力。
興趣是可以培養的,既然愿意看這篇文章,說明有興趣。理解、表達、動手能力,是要有意識的訓練。數據分析的專業能力,是可以通過學習提升的。
作為數據分析師,無論最初的職業定位方向是技術還是業務,最終發到一定階段后都會承擔數據管理的角色。因此,一個具有較高層次的數據分析師需要具備完整的知識結構。
?
1. 數據采集
了解數據采集的意義在于真正了解數據的原始面貌,包括數據產生的時間、條件、格式、內容、長度、限制條件等。這會幫助數據分析師更有針對性的控制數據生產和采集過程,避免由于違反數據采集規則導致的數據問題;同時,對數據采集邏輯的認識增加了數據分析師對數據的理解程度,尤其是數據中的異常變化。
?
2.數據存儲
無論數據存儲于云端還是本地,數據的存儲不只是我們看到的數據庫那么簡單。
?
3.數據提取
數據提取是將數據取出的過程,數據提取的核心環節是從哪取、何時取、如何取。
o 從哪取,數據來源——不同的數據源得到的數據結果未必一致。
o 何時取,提取時間——不同時間取出來的數據結果未必一致。
o 如何取,提取規則——不同提取規則下的數據結果很難一致。
?
4.數據挖掘
數據挖掘是面對海量數據時進行數據價值提煉的關鍵,以下是算法選擇的基本原則:
o 沒有最好的算法,只有最適合的算法,算法選擇的原則是兼具準確性、可操作性、可理解性、可應用性。
o 沒有一種算法能解決所有問題,但精通一門算法可以解決很多問題。
o 挖掘算法最難的是算法調優,同一種算法在不同場景下的參數設定相同,實踐是獲得調優經驗的重要途徑。
?
5.數據分析
數據分析相對于數據挖掘更多的是偏向業務應用和解讀,當數據挖掘算法得出結論后,如何解釋算法在結果、可信度、顯著程度等方面對于業務的實際意義,如何將挖掘結果反饋到業務操作過程中便于業務理解和實施是關鍵。
?
6.數據展現
數據展現即數據可視化的部分,數據分析師如何把數據觀點展示給業務的過程。數據展現除遵循各公司統一規范原則外,具體形式還要根據實際需求和場景而定。
?
7.數據應用
數據應用是數據具有落地價值的直接體現,這個過程需要數據分析師具備數據溝通能力、業務推動能力和項目工作能力。
數據溝通能力。深入淺出的數據報告、言簡意賅的數據結論更利于業務理解和接受,打比方、舉例子都是非常實用的技巧。
總結
- 上一篇: 大数据平台应用 17 个知识点汇总
- 下一篇: 最新数据分析与商业智能趋势前瞻