姚慧扬

2020-08-17   阅读量: 591

特征工程

扫码加入数据分析学习群

特征的定义:在数据科学过程中的有效属性(或字段) 的形式称为特征

特征工程的定义:特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程, 从而提高对未知数据预测的准确性

特征工程=数据准备(for 数据挖掘)

特征工程的目的:将信息使用更高效的编码方式(特征) 表示,

使用特征表示的信息, 信息损失较少, 原始数据中包含的规律依然保留

此外, 新的编码方式还需要尽量减少原始数据中的不确定因素(白噪声、 异常数据、 数据缺失等等) 的影响

<编码表示,损失信息要少,减少不确定因素>


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
32.3009 4 2 关注作者 收藏

评论(0)


暂无数据

推荐课程