python数据处理和数据分析的区别_python数据处理(七)之数据探索和分析
1.探索數(shù)據(jù)
1.1 安裝agate庫
1.2 導(dǎo)入數(shù)據(jù)
1.3 探索表函數(shù)
a.排序
b.最值,均值
c.清除缺失值
d.過濾
e.百分比
1.4 連結(jié)多個(gè)數(shù)據(jù)集
a.捕捉異常
b.去重
c.缺失數(shù)據(jù)的處理
d.聯(lián)結(jié)數(shù)據(jù)集
1.5 識(shí)別相關(guān)性
利用numpy分析
1.6 找出離群值
a.使用標(biāo)準(zhǔn)差
b.使用絕對(duì)中位差
(數(shù)據(jù)分布以及數(shù)據(jù)分布所展現(xiàn)的趨勢(shì))
1.7 數(shù)據(jù)分組
研究數(shù)據(jù)分組之間的關(guān)系(創(chuàng)建分組,聚合這些分組,確定分組之間的聯(lián)系)
2 分析數(shù)據(jù)
2.1 分析數(shù)據(jù)與探索數(shù)據(jù)的區(qū)別
分析數(shù)據(jù):提出問題并嘗試使用已經(jīng)有的數(shù)據(jù)回答這些問題。可以對(duì)數(shù)據(jù)集進(jìn)行組合和分組,以構(gòu)建一個(gè)統(tǒng)計(jì)可用的樣本
數(shù)據(jù)探索:研究數(shù)據(jù)集的一些趨勢(shì)和屬性,不嘗試去回答特定的問題或得出確定的結(jié)論
2.2 分離與聚焦數(shù)據(jù)
分離無用數(shù)據(jù),聚焦有用數(shù)據(jù)
2.3 尋找趨勢(shì)與模式
a.尋找趨勢(shì)與模式
b.發(fā)現(xiàn)聯(lián)系,深入的挖掘
2.4 描述結(jié)論
確定用什么方式分享這些結(jié)論
為了得到更全面的結(jié)論,需要更多的文檔,研究,這本身就是一個(gè)很重要的信息
2.5 將結(jié)論寫成文檔
將工作成果寫成文檔
總結(jié)
以上是生活随笔為你收集整理的python数据处理和数据分析的区别_python数据处理(七)之数据探索和分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据结构-链表1-顺序存储
- 下一篇: 爬虫2-web请求与http协议