小朱520

2020-08-10   阅读量: 879

机器学习

机器学习中对数据进行编码以及降维的操作

扫码加入数据分析学习群

12.png因为模型喂进去的数据需要是数值型的,所以在进行建模之前要对一些不是数值型的数据进行编码,图上步骤一是序列型编码的操作,步骤二是把数据中不是二分类的数值列筛选出来到column中进行哑编码如下图操作:

13.png

对于进行过哑编码的数据会存在维度增多数据过拟合等问题,这时候就需要进行降维(pca(主成分))下图就是降维的操作,

14.png1可以是数值也可以是百分比,数值代表降到几个维度,2是查看降维后每个维度所保留的信息百分比,3需要对测试集也要降维。

15.png这个mle是自动选取维度以获得信息百分比最大为目标,x_mle是降维以后的数据,一般解释性差(不知道降下的维度都是代表什么)但是可以优化数据模型。


34.4753 4 4 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子