姚慧扬

2020-08-04   阅读量: 723

机器学习

机器学习入门

扫码加入数据分析学习群

什么是机器学习?

专门研究计算机怎样模拟人类的学习行为,用获取到的新知识重新组织已有的知识结构,不断改善自身的性能


机器学习的分类:

监督学习(supervised learning)

无监督学习(unsupervised learning )

半监督学习(semi-supervised learning )

强化学习(reinforcement learning, 增强学习)


监督学习:训练模型时有样本对应的类别标签信息

泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律,

对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。(学习能力,不是背诵能力)


无监督学习:训练模型时没有样本对应的类别标签信息


半监督学习:训练数据有部分被标识, 部分没有被标识;思路见截图


强化学习:通过试错来发现最优行为策略而不是带有标签的样本学习。



在机器学习中, 要解决某一问题, 通常把问题转为成分类、回归、 聚类、 强化学习这四类问题进行解决

分类问题:根据数据样本抽取出的特征, 判定其属于有限个类别中的哪一个。(大多会产出一个概率值)

回归问题:根据样本上抽取的特征, 预测连续值结果。 属于有监督学习

聚类问题:根据数据样本抽取的特征, 挖掘出数据的关联模式


机 器 学 习 流 程 : 数 据 预 处 理 (Preprocessing ) 、 模 型 学 习(Learning) 、 模型评估(Evaluation) 、 新样本预测(Prediction)


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
34.9290 2 5 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子