读童话的狼

2020-06-21   阅读量: 696

数据分析师

如何用一行代码输出数据报告?

扫码加入数据分析学习群

pandas_profiling基于pandas的DataFrame数据类型,可以简单快速地进行探索性数据分析。

对于数据集的每一列,pandas_profiling会提供以下统计信息:

1、概要:数据类型,唯一值,缺失值,内存大小

2、分位数统计:最小值、最大值、中位数、Q1、Q3、最大值,值域,四分位

3、描述性统计:均值、众数、标准差、绝对中位差、变异系数、峰值、偏度系数

4、最频繁出现的值,直方图/柱状图

5、相关性分析可视化:突出强相关的变量,Spearman, Pearson矩阵相关性色阶图

并且这个报告可以导出为HTML,非常方便查看。

pandas_profiling的安装,在anaconda prompt中运行

pip install pandas_profiling -i https://pypi.tuna.tsinghua.edu.cn/simple

生成报告

import pandas as pd

import pandas_profiling as pp

data = pd.read_csv('titanic.csv',index_col=0)     #导入数据

report = pp.ProfileReport(data)  #生成报告

report

report.to_file('report.html')   #保存报告

报告展示

可以展示数据的描述信息,以及简单的动态交互image.png



添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
28.7494 4 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子