你应该是一阵风丫

机器学习【十一】管道模型

机器学习【十一】管道模型 涉及内容:基本概念和使用————在数据预处理中遇到的问题及使用管道模型解决 使用管道模型进行网格搜索———— 管道模型不仅可以把 数据预处理和模型训练集结合一起,也可以将很多不同的算法打包

你应该是一阵风丫

2020-10-17

42.8531 1 0
  • 关注作者
  • 收藏

机器学习【十】模型评估与优化

机器学习【十】模型评估与优化涉及内容:使用交叉验证对模型进行评估————sklearn中的交叉验证法、K折叠交叉验证法、随机拆分和“挨个儿试”使用网格搜索寻找模型的最优参数————简单网格搜索、局限性、与交叉验证结合的网格搜索、GridSearchCV进行参数调优的过程对分类模型的可信度进行评估————分类模型中的预测准确率、分类模型中的决定系数、.score给分类、回归模型评分的方法、Grid

你应该是一阵风丫

2020-10-17

42.8531 1 0
  • 关注作者
  • 收藏

机器学习【九】数据表达与特征工程

机器学习【九】数据表达与特征工程涉及内容:数据表达————类型特征、连续特征、使用哑变量转换类型特征、get_dummies的使用、把数值特征也进行get_dummies转换、装箱处理【离散化处理】、用新的方法来表达已经装箱的数据——OneHotEncoder,独热编码、数据“升维”————向数据集添加交互式特征、Numpy中的hstack函数、对特征进行交互式操作对模型产生的影响、向数据集添加多

你应该是一阵风丫

2020-10-17

42.8531 1 0
  • 关注作者
  • 收藏

机器学习【八】数据预处理、降维、特征提取及聚类

机器学习【八】数据预处理、降维、特征提取及聚类 涉及内容:数据预处理————StandardScaler预处理数据、MinMaxScaler数据预处理、RobustScaler数据预处理、Normalizer数据预处理通过数据预处理提高模型准确率————训练一个MLP神经网络、使用MinMaxScaler进行数据预处理数据降维————PCA主成分分析原理 对数据降维以便于进行可视化————原始特征

你应该是一阵风丫

2020-10-17

42.8531 1 0
  • 关注作者
  • 收藏

机器学习【七】神经网络

机器学习【七】神经网络 原理————MLP算法 神经网络中的非线性矫正————非线性矫正 rele 、进行双曲正切处理 tanh神经网络的参数设置————各个参数的含义、图像展示MLP分类的情况、减少隐藏层的节点、给MLP分类器增加隐藏层数量、设计激活函数为tanh、修改alpha参数 实战——手写识别————MNIST数据集、识别 优点计算能力充足且参数设置合适情况下,神经网络表现特优异对于特征

你应该是一阵风丫

2020-10-17

42.8531 1 0
  • 关注作者
  • 收藏

机器学习【六】支持向量机SVM——专治线性不可分

机器学习【六】支持向量机SVM——专治线性不可分涉及内容:SVM原理————核函数、数据投射至高维空间、多项式内核、RBF内核支持向量机的SVM核函数————创建一个线性内核的支持向量机模型、SVM内核换成RBFSVM的核函数和参数选择————不同核函数的SVM对比、linearSVM算法 RBF内核SVC的gamma参数调节————结果分析注意事项————3个非常重要的参数SVM在回归分析中的

你应该是一阵风丫

2020-10-17

42.8531 1 0
  • 关注作者
  • 收藏

机器学习【五】随机森林

机器学习【五】随机森林涉及内容:简介————是一种集合学习算法,可以用于分类,也可以用于回归、可解决过拟合问题随机森林构建 ————bootstrap 、max_features、n_estimators、图形看看随机分类的表现实战:判断月薪是否>5万————载入数据集、用get_dummies处理数据、用决策树建模并预测额外功能:在数据集中对数据特征的重要性进行判断————可以通过这两个算法

你应该是一阵风丫

2020-10-17

0.0000 0 0
  • 关注作者
  • 收藏

机器学习【四】决策树

机器学习【四】决策树 涉及内容:原理————if/else推导决策树构建————用决策树分类器分类【设定最大深度】、分类器表现、加大深度优点:很容易将模型可视化由于决策树算法对每个样本特征单独处理——> 不需要对数据进行转换不需要对数据预处理缺点:即使有预剪枝处理【使用max_depth、max_leaf_nodes参数】,还是不可避免出现过拟合问题泛化性能大打折扣

你应该是一阵风丫

2020-10-17

0.0000 0 0
  • 关注作者
  • 收藏

机器学习【三】朴素贝叶斯

机器学习【三】朴素贝叶斯涉及内容:基本概念————原理、贝叶斯定理、对天气的简单预测贝努利朴素贝叶斯————适合符合贝努利分布【二项分布】的数据集高斯朴素贝叶斯————适用样本的特征符合高斯分布【正态分布】多项式朴素贝叶斯————用于拟合多项式分布的数据集、数据预处理工具MinMaxScaler实战:判断肿瘤良性还是恶性————导入、拆分、拟合、随机预测、高斯朴素贝叶斯的学习曲线适用: 不考虑样本

你应该是一阵风丫

2020-10-17

0.0000 0 0
  • 关注作者
  • 收藏

机器学习【二】广义线性模型

机器学习【二】广义线性模型涉及内容: 线性模型的图形表示————导入线性模型、拟合数据点、拟合新加的数据点、训练数据集的属性“xx_” 线性模型特点—————用于回归分析的好几种线性模型之间的区别最基本的线性模型:线性回归————使用L2正则化的线性模型:岭回归————线性回归和岭回归之间的重要结论使用L1正则化的线性模型:套索回归————套索回归和岭回归的区别————适用:对于特征变量较多的数

你应该是一阵风丫

2020-10-17

0.0000 0 0
  • 关注作者
  • 收藏

机器学习【一】K最近邻算法

机器学习【一】K最近邻算法涉及内容:分类——————数据集生成器、KNN拟合数据多元分类————生成数据集、KNN拟合回归分析————用于回归分析的数据集生成器、KNN拟合、调整近邻数KNN实战—酒的分类————数据集有哪些键、生成训练集和测试集、KNN拟合、新样本的分类进行预测不适用: 需要对数据集认真的预处理对规模超大的数据集拟合的时间较长对高维数据集拟合欠佳对稀疏数据集无能为力

你应该是一阵风丫

2020-10-17

0.0000 0 0
  • 关注作者
  • 收藏

数据定义语言DDL:用于创建,修改,删除数据库中的各种对象(数据库、表、视图、索引等),常用命令有CREATE,ALTER,DROP

数据定义语言DDL:用于创建,修改,删除数据库中的各种对象(数据库、表、视图、索引等),常用命令有CREATE,ALTER,DROP

你应该是一阵风丫

2020-10-08

148.2722 3 1
  • 关注作者
  • 收藏

常用算法和应用场景总结

常用算法和应用场景总结

你应该是一阵风丫

2020-09-24

52.4235 2 0
  • 关注作者
  • 收藏

python中数据或者矩阵转化为列表的命令

python中数据或者矩阵转化为列表的命令

你应该是一阵风丫

2020-09-18

66.6667 1 0
  • 关注作者
  • 收藏

机器学习求职60问

类型一:基础概念类 问题1:过拟合与欠拟合(定义、产生的原因、解决的方法各是什么)。 问题2:L1正则与L2正则(有哪些常见的正则化方法?作用各是什么?区别是什么?为什么加正则化项能防止模型过拟合)。 问题3:模型方差和偏差(能解释一下机器学习中的方差和偏差吗?哪些模型是降低模型方差的?哪些模型是降低模型偏差的?举例说明一下)。 问题4:奥卡姆剃刀(说一说机器学习中的奥卡姆梯刀原理)。 问题5:模

你应该是一阵风丫

2020-09-17

35.9124 1 0
  • 关注作者
  • 收藏

关联规则总结

A、普通的的算法1.找出候选集和频繁集 创建候选1项集,根据最小支持度,生成频繁1项集。 创建候选2项集(频繁1项集的两两组合,去掉重复),再生成频繁2项集。 创建候选3项集(频繁2项集的两两组合,去掉重复),再生成频繁3项集。2.生成关联规则 针对任意k(k>=2)项集,生成如下的关联规则 R: f-β==>β 其中f是k项集,β是其任意真子集。 根据每一个关联规则的置信度和提升度,进行过滤。B

你应该是一阵风丫

2020-09-10

72.0378 2 0
  • 关注作者
  • 收藏

哑变量get_dummies 的参数用法

get_dummies 是利用pandas实现one hot encode的方式。get_dummies参数如下:pandas.get_dummies(data,prefix = None,prefix_sep =’_’,dummy_na = False,columns = None,sparse = False,drop_first = False,dtype = None )data : ar

你应该是一阵风丫

2020-09-09

79.1675 3 0
  • 关注作者
  • 收藏

二分类与多分类评估(混淆矩阵,准确率,召回率,F1,mAP)

在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式:召回率(Recall) = 系统检索到的相关文件 / 系统所有相关的文件总数准确率(Pre

你应该是一阵风丫

2020-09-02

27.6295 2 0
  • 关注作者
  • 收藏

KNN中使用Scikit-learn基本建模流程

基本流程:

你应该是一阵风丫

2020-08-31

40.3920 7 0
  • 关注作者
  • 收藏

机器学习

机器学习:

你应该是一阵风丫

2020-08-31

40.2833 4 0
  • 关注作者
  • 收藏
12>