数据分析的成长规划
數據分析師的成長之路
在學習數據分析之前應該明白幾點
數據初期的準備通常占整個數據挖掘項目工作量的70%左右。
數據分析師本身融合了業務知識、統計學和計算機等學科,并不是新的技術。
數據分析更適合業務人員學習(相比技術人員學習業務來的更高效)
數據分析項目通常需要重復一些毫無技術含量的工作。
以數據分析師為例,先看一下國內知名互聯網數據分析師的招聘要求:
計算機、統計學、數學等相關專業本科及以上學歷;
具有深厚的統計學、數據挖掘知識,熟悉數據倉庫和數據挖掘的相關技術,能夠熟練地使用SQL;
三年以上具有海量數據挖掘、分析相關項目實施的工作經驗,參與過較完整的數據采集、整理、分析和建模工作;
對商業和業務邏輯敏感,熟悉傳統行業數據挖掘背景、了解市場特點及用戶需求,有互聯網相關行業背景,有網站用戶行為研究和文本挖掘經驗尤佳;
具備良好的邏輯分析能力、組織溝通能力和團隊精神;
富有創新精神,充滿激情,樂于接受挑戰
從業務開始
學習一門技術要和行業靠攏,沒有行業背景的技術如空中樓閣。技術尤其是計算機領域的技術發展是寬泛且快速更替的(十年前做網頁設計都能成立公司),一般人沒有這個精力和時間全方位的掌握所有技術細節。但是技術在結合行業之后就能夠獨當一面了,一方面有利于抓住用戶痛點和剛性需求,另一方面能夠累計行業經驗,使用互聯網思維跨界讓你更容易取得成功。不要在學習技術時想要面面俱到,這樣會失去你的核心競爭力。
大數據是技術工具,最終的應用需要深入理解業務企業的業務場景和商業模式,甚至有人說不懂業務就不要談大數據,可見領域知識的重要性。值得一提的是,近幾年在頂尖科學雜志《Nature》與《Science》上發表的大數據文章都是來自行業專家,而并非計算機專家,這從另外一個方面反映了業務知識的重要性。
get技能
數學知識
數學知識是數據分析師的基礎知識。對于初級數據分析師,了解一些描述統計相關的基礎內容,有一定的公式計算能力即可,了解常用統計模型算法則是加分。對于高級數據分析師,統計模型相關知識是必備能力,線性代數(主要是矩陣計算相關知識)最好也有一定的了解。
分析工具
對于初級數據分析師,玩轉Excel是必須的,數據透視表和公式使用必須熟練,VBA是加分。另外,還要學會一個統計分析工具,SPSS作為入門是比較好的。對于高級數據分析師,使用分析工具是核心能力, SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。
編程語言
對于初級數據分析師,會寫SQL查詢,有需要的話寫寫Hadoop和Hive查詢,基本就OK了。對于高級數據分析師,除了SQL以外,學習Python是很有必要的,用來獲取和處理數據都是事半功倍。當然其他編程語言也是可以的。
以上來自:http://www.ppvke.com/Blog/archives/37780
做了一段時間的數據分析,一點個人的體會:
1、數據的前期準備非常重要,首先你需要特別了解你的數據,內容是什么,各類數據的范圍,大致特征;然后進行數據清洗和預處理,這些都是非常關鍵的步驟。
如果忽略以上的步驟或者完成的不到位,那么即使是在最后的建模階段,撰寫分析報告的階段,也都得回到最初的數據準備環節。
2、要熟練掌握常用的統計軟件,比如Excel,spss等,有時候如果對編程不熟悉的部分直接使用統計分析軟件,結果會更快和更方便。
在工作中,一方面要求效率,一方面要求準確性和數據的可用性,所以,有時候必須得充分考慮數據的特點和實際問題的結合,才能得出具有實用性的分析結果。
3、 學習的系統性
這一點非常重要,現在處于一個碎片化知識的整理和部分的加強階段。
4、習慣記錄!
學習的記錄是一個非常重要的環節,一方面是知識的鞏固,更重要的是一個邏輯的強化。
keep updating!
總結
- 上一篇: 谷歌插件 Web前端助手(FeHelp
- 下一篇: CentOS6.10安装详解