数据分析常用知识体系
數(shù)據(jù)分析常用知識體系
【數(shù)據(jù)獲取】
一、獲取原始數(shù)據(jù)
1、從數(shù)據(jù)庫?/?數(shù)據(jù)倉庫中獲取(數(shù)據(jù)庫?+?數(shù)據(jù)倉庫?+ SQL提數(shù))
2、爬蟲爬取(R語言爬蟲?+ Python爬蟲)
3、手工整理(問卷數(shù)據(jù)錄入、數(shù)據(jù)表制作等)
二、獲取整理好的數(shù)據(jù)
1、數(shù)據(jù)資源下載(統(tǒng)計(jì)局、經(jīng)管之家等)
2、數(shù)據(jù)資源調(diào)取(R語言內(nèi)置數(shù)據(jù)集、Python內(nèi)置數(shù)據(jù)集)
【數(shù)據(jù)預(yù)處理】
一、數(shù)據(jù)庫
1、常用數(shù)據(jù)庫基礎(chǔ)知識(Mysql、sqlServer、Oracle、Hbase + Hive)
2、SQL語句(數(shù)據(jù)查詢select from、數(shù)據(jù)去重distinct、數(shù)據(jù)限制where、數(shù)據(jù)排序order by、數(shù)據(jù)順序desc + asc、數(shù)據(jù)分組group by、數(shù)據(jù)過濾having、數(shù)據(jù)鎖定limit、條件關(guān)聯(lián)and + or + in / not in、通配符like + _、計(jì)算字段count + max + avg等、子查詢、表聯(lián)結(jié)inner join + left join + right join、插入數(shù)據(jù)insert into、創(chuàng)建表create、更新數(shù)據(jù)update、刪除數(shù)據(jù)delete、刪除表drop)
二、EXCEL
1、工作表處理(格式設(shè)置、數(shù)據(jù)編輯)
2、數(shù)據(jù)查看(篩選、排序、查找替換、分類匯總、數(shù)據(jù)透視表、數(shù)據(jù)透視圖)
3、函數(shù)(vlookup、計(jì)算函數(shù)等)?+?圖表制作(基礎(chǔ)圖形?+?改進(jìn)圖形)
三、R
1、數(shù)據(jù)讀寫(讀取csv文件、讀取txt文件等)
2、數(shù)據(jù)查看(查看數(shù)據(jù)整體情況View、查看數(shù)據(jù)前幾行head和后幾行tail、查看數(shù)據(jù)的維度dim、查看數(shù)據(jù)的類型class、查看數(shù)據(jù)中各變量的基礎(chǔ)情況str、查看數(shù)據(jù)長度length)
3、數(shù)據(jù)檢查與基本處理(數(shù)據(jù)轉(zhuǎn)換as.vector + as.data.frame、數(shù)據(jù)連接rbind + cbind等)
4、數(shù)據(jù)運(yùn)算(數(shù)學(xué)運(yùn)算、統(tǒng)計(jì)運(yùn)算、函數(shù)運(yùn)算)
5、數(shù)據(jù)清洗(缺失值、異常值、數(shù)據(jù)格式化)
四、Python
同上述R語言,但為Python代碼
【數(shù)據(jù)建模分析】
一、常用業(yè)務(wù)模型
1、通用業(yè)務(wù)模型(RFM?、AARRR、5W2H、波士頓矩陣、波特五力模型、4P理論等)
2、行業(yè)專用模型(教育行業(yè)、互聯(lián)網(wǎng)行業(yè)、交通行業(yè)、醫(yī)藥行業(yè)等)
二、常用數(shù)學(xué)?/?統(tǒng)計(jì)?/?機(jī)器學(xué)習(xí)知識
1、描述統(tǒng)計(jì)(平均數(shù)、中位數(shù)、眾數(shù)、方差、標(biāo)準(zhǔn)差、分位數(shù)、極差、偏度、峰度等)
2、推斷統(tǒng)計(jì)(區(qū)間估計(jì)、假設(shè)檢驗(yàn)、方差分析、回歸分析)
3、常用模型(關(guān)聯(lián)規(guī)則、決策樹、聚類分析、神經(jīng)網(wǎng)絡(luò)、SVM、隨機(jī)森林等)
4、模型評價(jià)(混淆矩陣、ROC曲線等)
三、R
上述各模型的R代碼
四、Python
上述各模型的Python代碼
——————————————————★
互聯(lián)網(wǎng)數(shù)據(jù)分析崗位求職備戰(zhàn)手冊
總結(jié)
以上是生活随笔為你收集整理的数据分析常用知识体系的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android 超级简单的沉浸式状态栏
- 下一篇: html制作文字效果,使用backgro