hopeiagt

2020-05-31   阅读量: 1531

Python数据分析

为什么需要对数据进行标准化处理?

扫码加入数据分析学习群

当我们想要比较以不同单位为度量的数据时,将不同的特征平移到以0为中心,以1为标准差的附近是十分重要的.变量的不同规模将对结果造成不等的贡献水平(实际我们想要的是基于一个贡献标尺下,计算不同变量对目标对象的影响),从而会造成有偏估计.例如,如果一个变量的变动范围在0到10000,另一个变量的变动范围在0到1.如果没有标准化的处理,将会造成变动范围在0到10000的变量对目标值的影响是变动范围在0到1的变量的10000倍.而将不同的变量进行标准化处理后,将会通过将变量放缩到可比较的标尺中进行研究,以防止类似问题的发生.

27.1648 2 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子