监督学习:对具有标记的训练样本进行学习,这里,所有的标记是已知的。如:决策树算法、朴素贝叶斯算法、KNN 算法。无监督学习:对没有标记的训练养样本进行学习,目的是为了发现训练集中的结构特征。如聚类算法
网格化搜索:对于多个参数,首先根据经验确定大致的参数范围。然后选择较大的步长进行控制变量的方法进行搜索,找到最优解后;然后逐步缩小步长,使用同样的方法在更小的区间内寻找更精确的最优解。
1) 对于离群点和孤立点敏感:数据归一化和离群点处理。2) k值选择:手肘法,轮廓系数法选择3) 初始聚类中心的选择:多次选择4) 大数据集minibachkmeans