你应该是一阵风丫

2020-10-17   阅读量: 17

机器学习【九】数据表达与特征工程

机器学习【九】数据表达与特征工程

涉及内容:

数据表达————类型特征、连续特征、使用哑变量转换类型特征、get_dummies的使用、把数值特征也进行get_dummies转换、装箱处理【离散化处理】、用新的方法来表达已经装箱的数据——OneHotEncoder,独热编码、

数据“升维”————向数据集添加交互式特征、Numpy中的hstack函数、对特征进行交互式操作对模型产生的影响、向数据集添加多项式特征、PolynomialFeatures、处理后机器学习的模型的变化

自动特征选择————使用单一变量法进行特征选择、使用SelectPercentile进行特征选择、基于模型的特征选择、迭代式特征选择、递归特征剔出法RFE

对样本特征进行装箱的好处:

  • 纠正模型过拟合和欠拟合问题

  • 尤其针对大规模高纬度的数据集使用线性模型的时候,可以大幅度提高预测的准确率


42.8531 1 0 关注作者 收藏

评论(0)


暂无数据

推荐帖子


    暂无数据

推荐课程