小朱520

机器学习中构建决策树中ID3算法和C4.5的算法的区别

ID3算法决策树是通过信息增益的值得大小来构造决策树最大的为顶层,如图示例C4.5是通过信息增益率来构建决策树,根据值最的为顶层,算法如图这里算的为outlook的信息增益率,14为样本总数。当然可以以此来计算其他。

小朱520

2020-08-08

37.4340 2 0
  • 关注作者
  • 收藏

机器学习中关于决策树的各结点是否可以重复使用的解释

对于决策树算法而言,如果说上一节点为分类型变量的话,下一节点不可以使用这个属性,如图outlook为分类型变量,如果下面没有分完是不可以再使用了,但是如果上一节点是离散型变量,好比是humidity这个变量,如果下面的yes项并没有分完是还可以在yes节点使用humidity这个变量继续分,只不过是需要在小于70的这个连续变量中重新确定阈值在划分。(而这个windy虽然在上面的别的枝干使用过了,但

小朱520

2020-08-08

37.4340 2 1
  • 关注作者
  • 收藏

python中的一些导入文件的代码

%matplotlib inline 在线显示图片import numpy as npdata = np.genfromtxt('kmeans.txt',delimiter=' ') 使用np导入文件import pandas as pddata=pd.read_csv('D:\CDA\File\datingTestSet.txt',sep=' ',names=['x1','x2','x3','y

小朱520

2020-08-07

32.3851 4 3
  • 关注作者
  • 收藏

机器学习中关于聚类和分类中k值得解释

在算法kmeans中的k代表数据分类的簇数应用于聚类,原始数据为分散数据,k=n_clusters,一般为10个以内。在算法knn中k代表,原数据已经分好类用于新数据的预测分类,k=n-neighbors,表示选择样本数据中前k个最相似的数据,应用于分类。

小朱520

2020-08-07

37.7656 4 3
  • 关注作者
  • 收藏

机器学习中聚类中kmeans关于k值(分为几个簇)的代码展示(肘部优化法则)

这里的sse代表的是每个质心与本簇其他样本的距离,一般最优的效果是哪个拐点k=4

小朱520

2020-08-07

37.5657 2 4
  • 关注作者
  • 收藏

python关于knn的分类报告各个数值的解释

precision为精准率 recall为召回率 f1-score为调和参数 support为样本总数 其中1/p+1/r=2/f accuracy 为正确率 macro avg 宏平均 = 3类样本precision的均值=(1+1+1)/3weighted avg 加权平均=3类样本的每个precision乘以每类的support除以总样本support45(1*

小朱520

2020-08-06

22.5540 3 0
  • 关注作者
  • 收藏

机器学习,knn中的参数n-jobs的理解

这里的n_jobs=-1表示的是把电脑里的相关配置全部运行计算,一般为默认可以不设置。

小朱520

2020-08-05

22.6493 4 2
  • 关注作者
  • 收藏

python中的机器学习关于特征筛选的理解

特征筛选是在处理完异常值和缺失值之后,筛选出除了业务经验变量之外的x变量,一般为删除30%的保留70%就是第三部中的(score_func=f_regression,percentile=70上面的60换成70,这句代码的意思是保留百分之七十的有效x变量,第4步是对进行筛选的变量重新传入运行,第5步是对筛选后的值进行合并,x.iloc[:,fit.get_support(indices=True)

小朱520

2020-07-29

28.4000 4 4
  • 关注作者
  • 收藏

用python语法进行批量读取文件的格式

使用0S.进行批量读取数据文件的格式具体为第4第5,其中lagou-copy为要读取数据的总文件夹,第11条为过滤出来除了自己所需要的csv文件以外的不需要文件类型第15条为查询所读入的需要文件格式,

小朱520

2020-07-26

70.3942 2 0
  • 关注作者
  • 收藏

python

注意区分这里的math.exp()只能是对一个数进行e的x方运算,而np.exp可以是对一个数组进行计算。

小朱520

2020-07-24

41.2514 3 2
  • 关注作者
  • 收藏

python

对于随机数种子的理解可以是如果两台设备同时设置同一个种子数那么出现的随机数就会出现一样的结果,否则反之。

小朱520

2020-07-24

25.4593 3 2
  • 关注作者
  • 收藏

python

在使用jupyter默认是只输出命令行中最后一条输出命令的结果,设置了下面那条代码,就可以输出全部全部代码执行的结果

小朱520

2020-07-24

41.2514 3 3
  • 关注作者
  • 收藏

python

单纯的操作,使用matplotlib.pyplot进行画图是不支持中文标题的,需要执行下面的代码即可,一个是windows电脑,一个是mac电脑。

小朱520

2020-07-24

25.5325 4 4
  • 关注作者
  • 收藏

python

把列表中的每个元素乘以2,python的内置map函数和for循环生成的

小朱520

2020-07-23

35.7975 2 3
  • 关注作者
  • 收藏

python

python的一些可变量和不可变量

小朱520

2020-07-15

13.5654 2 5
  • 关注作者
  • 收藏

python

python中的偶数累加和计算实例

小朱520

2020-07-14

34.0067 2 3
  • 关注作者
  • 收藏

python

python基础里的一些注意点

小朱520

2020-07-13

34.9003 4 3
  • 关注作者
  • 收藏

统计学 ,矩阵

矩阵乘法的注意点

小朱520

2020-07-09

18.4190 3 2
  • 关注作者
  • 收藏

sql

普通分组和开窗分组的区别

小朱520

2020-07-02

22.8944 3 1
  • 关注作者
  • 收藏

bi

bi中的销售指标

小朱520

2020-06-30

19.1842 2 5
  • 关注作者
  • 收藏

上一页1234>