日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python数据分析并生成报告_pandas_profiling :教你一行代码生成数据分析报告

發布時間:2024/4/14 python 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python数据分析并生成报告_pandas_profiling :教你一行代码生成数据分析报告 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

分析報告全貌

什么是探索性數據分析

熟悉pandas的童鞋估計都知道pandas的describe()和info()函數,用來查看數據的整體情況,比如平均值、標準差之類,就是所謂的探索性數據分析-EDA。

pandas_profiling簡介

如果你想更方便快捷地了解數據的全貌,泣血推薦一個python庫:pandas_profiling,這個庫只需要一行代碼就可以生成數據EDA報告。

pandas_profiling基于pandas的DataFrame數據類型,可以簡單快速地進行探索性數據分析。

對于數據集的每一列,pandas_profiling會提供以下統計信息:

1、概要:數據類型,唯一值,缺失值,內存大小

2、分位數統計:最小值、最大值、中位數、Q1、Q3、最大值,值域,四分位

3、描述性統計:均值、眾數、標準差、絕對中位差、變異系數、峰值、偏度系數

4、最頻繁出現的值,直方圖/柱狀圖

5、相關性分析可視化:突出強相關的變量,Spearman, Pearson矩陣相關性色階圖

并且這個報告可以導出為HTML,非常方便查看。

pandas_profiling安裝

安裝pandas_profiling可以使用pip、conda或者下載文件安裝,非常方便。

我這里使用pip方式,在命令行輸入:

pip install pandas-profiling

本文在Jupyter notebook中進行代碼實驗。

pandas_profiling使用方法

1、加載數據集

我這里用經典的泰坦尼克數據集:

# 導入相關庫

import seaborn as sns

import pandas as pd

import pandas_profiling as pp

import matplotlib.pyplot as plt

# 加載泰坦尼克數據集

data = sns.load_dataset('titanic')

data.head()

輸出:

2、使用pandas_profiling生成數據探索報告

report = pp.ProfileReport(data)

report

輸出報告:

3、導出為html文件

report.to_file('report.html')

總結

pandas_profiling可以用一行代碼生成詳細的數據分析報告,與pandas深度結合,非常適合前期的數據探索階段,以及結果數據報告批量化生產。對不太熟悉python數據分析的新手來說,這是一個非常好用的工具。

總結

以上是生活随笔為你收集整理的python数据分析并生成报告_pandas_profiling :教你一行代码生成数据分析报告的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。