读童话的狼
2020-09-09 阅读量: 285
OneHotEncoder 原理是将有n个类别的特征转换成n个二分特征属性,值取为0或1。因此,One-Hot Encoder是会根据特征取值的类别改变数据特征数目的,因为扩展了特征的个数,并返回二值类别数值,势必会造成数据的稀疏问题.
举一个常用的例子,我们想要研究的类别取值为小学、中学、大学、硕士、博士的特征,我们使用one-hot对其编码就会得到: