你应该是一阵风丫

2020-10-17   阅读量: 13

机器学习【八】数据预处理、降维、特征提取及聚类

机器学习【八】数据预处理、降维、特征提取及聚类

涉及内容:

数据预处理————StandardScaler预处理数据、MinMaxScaler数据预处理、RobustScaler数据预处理、Normalizer数据预处理

通过数据预处理提高模型准确率————训练一个MLP神经网络、使用MinMaxScaler进行数据预处理

数据降维————PCA主成分分析原理

对数据降维以便于进行可视化————

原始特征与PCA主成分之间的关系————

特征提取————PCA主成分分析法用于特征提取、使用一些方法来提升模型的表现、PCA中的数据白化功能、非负矩阵分解用于特征提取

聚类算法————K均值算法、凝聚聚类算法、DBSCAN算法、eps参数、min_samples参数

适用数据降维的情况:

  • 超高维度数据

  • 特征之间有非常强烈的相关性【比如,人口数据中,男性为1,女性为0,去掉其中任何一列,不会丢失任何信息,可以降维,以降低模型的复杂度】


42.8531 1 0 关注作者 收藏

评论(0)


暂无数据

推荐帖子


    暂无数据

推荐课程