bigdata~
2020-08-27 阅读量: 728
ID3: 适用于分类问题(即标签Y是离散的),要求特征离散,根据信息增益最大选择特征,无剪枝策略,不能处理缺失值
C4.5: 适用于分类问题,特征可以离散或连续(二分裂处理),根据信息增益率最大选择特征,有剪枝策略,可以处理缺失值
CART: 适用于分类和回归问题,特征可以离散可以连续,有剪枝策略,可以处理缺失值
对于分类问题:根据基尼系数最小原则选择特征
对于回归问题:根据平方误差最小选择特征