读童话的狼

2020-09-09   阅读量: 285

什么是独热编码

扫码加入数据分析学习群

OneHotEncoder 原理是将有n个类别的特征转换成n个二分特征属性,值取为0或1。因此,One-Hot Encoder是会根据特征取值的类别改变数据特征数目的,因为扩展了特征的个数,并返回二值类别数值,势必会造成数据的稀疏问题.

举一个常用的例子,我们想要研究的类别取值为小学、中学、大学、硕士、博士的特征,我们使用one-hot对其编码就会得到:

image.png

68.3697 3 0 关注作者 收藏

评论(0)


暂无数据

推荐课程