Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略
生活随笔
收集整理的這篇文章主要介紹了
Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Python之pandas-profiling:pandas-profiling庫的簡介、安裝、使用方法之詳細攻略
?
?
?
?
目錄
pandas-profiling庫的簡介
pandas-profiling庫的安裝
pandas-profiling庫的使用方法
1、基礎用法
?
?
?
pandas-profiling庫的簡介
? ? ? ? 從pandas數據路由生成配置文件報告。pandas df.describe()函數很棒,但對于嚴肅的探索性數據分析來說有點基礎。pandas_profiling通過php .profile_report()擴展了pandas DataFrame,用于快速數據分析。對于每一列,以下統計數據-如果與列類型相關-在一個交互式HTML報告中顯示:
- 類型推斷:檢測數據流中的列類型。
- 基本要素:類型、唯一值、缺失值
- 分位數統計如最小值,Q1,中位數,Q3,最大值,范圍,四分位數范圍
- 描述統計,如平均值,眾數,標準差,總和,中位數絕對偏差,變異系數,峰度,偏度
- 最常見的價值觀
- 柱狀圖
- 高度相關變量的相關性突出,Spearman, Pearson和Kendall矩陣
- 缺失值矩陣,計數,熱圖和缺失值的樹狀圖
- 學習文本數據的分類(大寫,空格),腳本(拉丁語,西里爾字母)和塊(ASCII)。
- 文件和圖像分析提取文件大小,創建日期和尺寸和掃描截短的圖像或那些包含EXIF信息。
?
?
?
pandas-profiling庫的安裝
pip install pandas-profiling
?
?
?
pandas-profiling庫的使用方法
1、基礎用法
import numpy as np import pandas as pd from pandas_profiling import ProfileReportdf = pd.DataFrame(np.random.rand(100, 5),columns=["a", "b", "c", "d", "e"] )profile = ProfileReport(df, title="Pandas Profiling Report") profile.to_file("your_report.html")profile = ProfileReport(large_dataset, minimal=True) profile.to_file("output.html")profile = df.profile_report(title='Pandas Profiling Report', plot={'histogram': {'bins': 8}}) profile.to_file("output.html")?
?
?
?
?
總結
以上是生活随笔為你收集整理的Python之pandas-profiling:pandas-profiling库的简介、安装、使用方法之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python之gmplot:gmplot
- 下一篇: websocket python爬虫_p