姚慧扬
2020-08-17 阅读量: 591
特征的定义:在数据科学过程中的有效属性(或字段) 的形式称为特征
特征工程的定义:特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程, 从而提高对未知数据预测的准确性
特征工程=数据准备(for 数据挖掘)
特征工程的目的:将信息使用更高效的编码方式(特征) 表示,
使用特征表示的信息, 信息损失较少, 原始数据中包含的规律依然保留
此外, 新的编码方式还需要尽量减少原始数据中的不确定因素(白噪声、 异常数据、 数据缺失等等) 的影响
<编码表示,损失信息要少,减少不确定因素>