你应该是一阵风丫

2020-10-17   阅读量: 662

机器学习【九】数据表达与特征工程

扫码加入数据分析学习群

机器学习【九】数据表达与特征工程

涉及内容:

数据表达————类型特征、连续特征、使用哑变量转换类型特征、get_dummies的使用、把数值特征也进行get_dummies转换、装箱处理【离散化处理】、用新的方法来表达已经装箱的数据——OneHotEncoder,独热编码、

数据“升维”————向数据集添加交互式特征、Numpy中的hstack函数、对特征进行交互式操作对模型产生的影响、向数据集添加多项式特征、PolynomialFeatures、处理后机器学习的模型的变化

自动特征选择————使用单一变量法进行特征选择、使用SelectPercentile进行特征选择、基于模型的特征选择、迭代式特征选择、递归特征剔出法RFE

对样本特征进行装箱的好处:

  • 纠正模型过拟合和欠拟合问题

  • 尤其针对大规模高纬度的数据集使用线性模型的时候,可以大幅度提高预测的准确率


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
42.8531 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程