张敏玉

2020-08-06   阅读量: 1829

数据分析师 统计学 大数据 描述统计 数据分析报告

描述统计分析报告考试成绩案例

扫码加入数据分析学习群

(描述统计分析)

对学生成绩进行排序,得到表1:

1 学生考试成绩排序表

排序

小 → 大

35

60

72

76

89

46

61

72

76

89

51

63

74

77

92

52

65

74

77

93

53

67

74

78

94

53

68

74

79

95

56

69

74

80

98

58

70

75

85

99

58

71

75

87

——

59

72

75

88

——

(1)结合原始资料和表1数据,班级总人数n=50,本次考试实际参加人数n=48人,缺考2人;考试试卷总分100分,60分及格;学生考试得分中,最低分为35分,最高分为99分。

(2)将表1数据进一步处理,得到表2。

2 学生考试成绩分组表

分数区间

人数

百分比

向上累计

向下累计

人数

百分比

人数

百分比

30以下

0

0.00%

0

0.00%

48

100.00%

[30-40)

1

2.08%

1

2.08%

48

100.00%

[40-50)

1

2.08%

2

4.17%

47

97.92%

[50-60)

8

16.67%

10

20.83%

46

95.83%

[60-70)

7

14.58%

17

35.42%

38

79.17%

[70-80)

19

39.58%

36

75.00%

31

64.58%

[80-90)

6

12.50%

42

87.50%

12

25.00%

90以上

6

12.50%

48

100.00%

6

12.50%

合计

48

100.00%

——

——

——

——

结合原始资料,本次考试的参与率为96%(应考50人,实考48人)。

从表2可以看出,优秀成绩人数6人(大于等于90分),占考试人数比重12.50%;良好成绩人数6人(80≤分数<90),占考试人数比重12.50%;中等成绩人数19人(70≤分数<80),占考试人数比重39.58%;合格人数7人(60≤分数<70),占考试人数比重14.58%;不及格人数10人,占总人数比重20.83%。

总体上看,48名参加考试人员中,及格人数38人(大于等于60分),及格率(相对于考试人数)79.17%。

此外,本次考试中等成绩人数最多,优秀、良好、合格人数分布较均匀,不及格人数偏多,初步判断数据分布存在典型的偏情形。

(3)根据表1数据计算,得到表3结果。

3 考试成绩集中趋势表

平均

中位数

众数

标准差

方差

峰度

偏度

72.46

74

74

14.31

204.89

-0.10079

-0.22855

从表3可以看出,本次48人考试成绩的平均分=72.46,中位数Me=74分,众数Mo=74分,三个指标均落在中等成绩的范围内,可以认为此次考试的成绩整体情况属于中等。

分析成绩中等的原因,主要应属于考试试卷具有一定难度,一方面让较多同学不及格,同时高分学生并不多,其余同学主要集中在60到90分内,特别是70到80分的学生较多(19人,占39.58%)。

平均分、中位数、众数的大小关系属于<Me<Mo情形,可以认为数据分布属于左偏情形,与(2)中的初步判断一致。

平均分比中位数、众数小,是由于较多学生考试成绩不及格,使得平均分受极小值影响较大,拉低平均分。

(4)进一步计算考试成绩的离散程度,得到表4。

4 考试成绩离散程度表

标准差

方差

14.31

204.89

从表4计算结果可以看出,48人考试成绩的标准差s =14.31(方差s2= 204.89),考试成绩较分散,同时也说明数据集中趋势指标的代表性较差(特别是平均数),数据可能存在扁平状态的分布。

此外,从最高分99分,最低分35分(或从优秀人数6人,不及格人数10人)可以看出,考试人员成绩差距较大,呈现两极分化情形。

(5)进一步计算考试成绩的分布形态,得到表5。

5 考试成绩分布形态表

偏态系数

峰态系数

-0.22855

-0.10079

从表5计算结果可以看出,本次48人考试成绩的偏态系数SK= -0.22855 < 0,可以认为成绩分布属于左偏分布(负偏),这与(2)(3)中的判断是一致的。

峰态系数K= -0.10079 < 0,可以认为成绩分布属于稍微扁平分布情形(这与(4)中的判断是一致的),说明成绩的集中趋势区域分布相比较于标准正态分布要低,这应该是因为不合格、合格、良好、优秀等部分的人数相对于中等部分的人数均较多而导致,使得集中趋势位置很难形成高度的集中。

综上可以得出:①本次考试的考试试卷相对于考生具有一定难度;②考生考试成绩整体处于中等水平;③学生的学习情况呈现严重的两极分化情形,且学习情况较差的人数相对于优秀人数要多,使得总体成绩呈现典型的左偏分布;④与标准正态分布的分布情况相比,合格、良好、优秀部分的学生较多,使得数据集中趋势区域呈现一定的扁平状态,表明优秀、良好学生较多,可以通过提高其学习效果,进一步培养更多优秀学生,从而提高整体的成绩情况;⑤同时建议加强对低分同学的重点关注。


22.6125 4 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子