张敏玉

2020-08-06   阅读量: 127

数据分析师大数据统计学微积分线性代数

描述统计分析

如何做描述统计分析(撰写一 份数据描述统计分析报告)?

五个角度:

一.总体规模的描述——总量指标

二.对比关系的描述——相对指标

三.集中趋势的描述——平均指标

四.离散程度的描述——变异指标

五.分布形态的描述——偏态与峰态



一.总体规模的描述——总量指标

总量指标:反映在一定时间.空间条件下某种现象 的总体规模、总水平或总成果的统计指标


二.对比关系的描述——相对指标

相对指标:又称“相对数”,是两个有相互联系的指标数值 之比

常用相对指标的计算

⚫计划完成程度相对指标:实际完成/计划完成

⚫结构相对指标:部分/总体

⚫比例相对指标:一部分/另一部分

⚫比较相对指标:A的指标/B的相同指标

⚫强度相对指标:某总量指标/另一性质不同但关联的总量指标

⚫动态相对指标:报告期/基期



三.集中趋势的描述——平均指标

集中趋势 定义:一组数据向其中心值靠拢的趋势

测度集中趋势就是寻找数据水平的代表值或中心值


(一)众数(mode) 1.定义:出现次数最多的变量值 2.表示的符号: 3.计算:寻找数据中出现次数最多的值 众数的不唯一性

(二)分位数 【分位数:是指根据对数据位置进行划分,处于某些 特定位置上的数。常用的分位数有二分位数(也叫“中 位数”)、四分位数、十分位数、百分位数等,这里重 点讲中位数和四分位数。】

  1. 中位数(median) ①定义:数据排序后,处于中间位置上的值; ②表示的符号: ③计算:数据的个数为 ,则 中位数位置=(n+1)/2

2.四分位数(quartile) ①定义:四分位数分下四分位数和上四分位数两种, 指排序后处于25%和75%位置上的值。 ②表示的符号:下四分位数 QL,上四分位数QU ③计算:数据的个数为n ,则

下四分位数 QL的位置: n/4

上四分位数 QU的位置:3n/4


三.数值型数据:均值(mean) 算术平均数 调和平均数 几何平均数 幂平均数


5.png

四.离散程度的描述——变异指标


离散程度 1.定义:反映各变量值远离其中心值的程度,是数 据分布的另一个重要特征 2.从另一个侧面说明了集中趋势测度值的代表程度


微信图片_20200804163007.png

1.极差(range) (1)定义:一组数据的最大值与最小值之差; (2)表示的符号:R (3)计算:R = max(xi) - min(xi) (4)特点: ①离散程度的最简单测度值 ②极易受极端值影响 ③未考虑数据的分布

五.分布形态的描述——偏态与峰态



22.5216 3 0 关注作者 收藏

评论(0)


暂无数据

推荐帖子

推荐课程