标准化常量? 这是为啥

2020-05-08 阅读量: 931

机器学习

标准化常量? 这是为啥

扫码加入数据分析学习群

目的：通过对数据进行标准化处理，得到均值为0，标准差为1的服从标准正态分布的数据。（相对一维数据来说，也就是相对矩阵的每一列，数据的每一个维度）

向量形式，它们的每个元素分布表示矩阵每一列的均值和方差）可以看出矩阵中心化是标准化的一步，将中心化的矩阵除以标准差得到标准化矩阵。

下面解释一下为什么需要使用这些数据预处理步骤：
在一些实际问题中，我们得到的样本数据都是多个维度的，即一个样本是用多个特征来表示的。比如在预测房价的问题中，影响房价y的因素有房子面积x₁，卧室数量x₂等，我们得到的样本数据就是(x₁,x₂)这样一些样本点，这里的x₁，x₂又被称为特征。很显然，这些特征的量纲和数值的量级都是不一样的（比如房子面积x₁的单位是..m²，80m²，100m²；而卧室数量x₂单位是..间，1间，2间），在预测房价时，如果直接使用原始的数据值，那么它们对房价的影响程度将是不一样的，而通过标准化处理，可以使得不同的特征具有相同的尺度（Scale）。这样，在使用梯度下降法学习参数的时候，不同特征对参数的影响程度就一样了。