马锦涛

在python机器学习的线性回归矩阵相乘为什么要把数据类型改为mat()

在numpy 中矩阵相乘的结果是以广播的形式得到结果的,但是线性回归需要的计算并不是这样,因此需要转变数据格式。

马锦涛

7小时前

0.0000 0 0
  • 关注作者
  • 收藏

标准化和归一化的区别

归一化是为了将数据映射到0~1之间,去掉量纲的过程,让计算更加合理,不会因为量纲问题导致1米与100mm产生不同。归一化是线性模型做数据预处理的关键步骤,比如LR,非线性的就不用归一化了。标准化消除分布产生的度量偏差,标准化更好保持了样本间距。·

马锦涛

8小时前

0.0000 0 0
  • 关注作者
  • 收藏

KNN,聚类,决策树三者的比较

KNN算法的优点理论成熟,思想简单,既可以用来做分类也可以用来做回归、可用于非线性分类、对数据没有假设,准确度高KNN算法的缺点计算量大、样本不平衡问题(即有些类别的样本数量很多,而其它样本的数量很少)、需要大量的内存;决策树自身的优点计算简单,易于理解,可解释性强、比较适合处理有缺失属性的样本、能够处理不相关的特征、在相对短的时间内能够对大型数据源做出可行且效果良好的结果。决策树自身的缺点容易发

马锦涛

4天前

68.6401 2 0
  • 关注作者
  • 收藏

KNN算法的优缺点?

KNN算法的优点理论成熟,思想简单,既可以用来做分类也可以用来做回归;可用于非线性分类;训练时间复杂度为O(n);对数据没有假设,准确度高,对outlier不敏感;缺点计算量大;样本不平衡问题(即有些类别的样本数量很多,而其它样本的数量很少);需要大量的内存;

马锦涛

2020-09-16

37.4872 1 0
  • 关注作者
  • 收藏

Python中random_state 的作用是什么?

随机数种子(random_state)随机数就是就随机数种子中取出的数。种子就是个序号,这个序号交给一个数列管理器,通过这个序号,你从管理器中取出一个数列,这个数列就是你通过那个序号得到的随机数。但这个随机数并不真正随机。因为它是通过某个算法的得到。也就是说你给数列管理器同一个序号将得到同样一个“随机”数列。也就是说种子和随机数列是一一对应的。

马锦涛

1周前

36.1385 1 0
  • 关注作者
  • 收藏

Python机器学习中为什么要切分数据?

模型训练的目的是为了测试未知数据的效果,但是未知数据是没有标签的,我们只有将已知数据进行切分才能测试数据的拟合度。

马锦涛

1周前

36.1385 1 0
  • 关注作者
  • 收藏

什么是过拟合?

数据在训练集上拟合的特别好,但是在测试集上拟合的比较差,一般是因为训练集上噪音的影响。

马锦涛

1周前

30.4704 1 0
  • 关注作者
  • 收藏

代替 for in 的几种方法

我们知道当数据比较大的时候,用for in 会比较慢,以下有几种可以替代的方法1、列表方程式2、广播3、矩阵

马锦涛

1周前

30.4704 1 0
  • 关注作者
  • 收藏

什么是KNN算法?

1.k-近邻算法,它的本质是通过距离判断两个样本是否相似,如果距离够近就认为他们足够相似属于同一类别。当然只对比一个样本是不够的,误差会很大,我们需要找到离其最近的k个样本,并将这些样本称之为「近邻」(nearest neighbor)。对这k个近邻,查看它们的都属于何种类别(这些类别我们称作「标签」(labels))。然后根据“少数服从多数,一点算一票”原则进行判断,数量最多的的标签类别就是新样

马锦涛

1周前

30.4704 1 0
  • 关注作者
  • 收藏

python中如何填补缺失值?

填补缺失值,一般来说按列进行填补,首先看的缺失值的比列,有80%以上,50% ~ 80%,小于50%三种。如果有80%以上的值,缺失值小于20%,简单统计指标进行填补,主要填补方法有数值型(np.mean)、分类型(众数)、层次概念类别(众数,中位数)。50% ~ 80%,算法模型去填补,KNN,RF,拉格朗日差值,这种模型去填补小于50%,50%左右,变成另一种变量,缺失了和没缺失(1,0)。时

马锦涛

1周前

43.8470 2 0
  • 关注作者
  • 收藏

python的numpy数据库中显式索引和隐式索引的区别

1、在numpy数据库中,显式索引指的是loc,隐式索引指的是iloc,通俗地讲显式索引就是在表里面看到什么就是什么,而隐式索引与之相反。

马锦涛

1周前

32.4776 1 0
  • 关注作者
  • 收藏

测试一下

测试一下呀

马锦涛

1周前

0.0000 0 0
  • 关注作者
  • 收藏

​正则化的原理试什么?

正则化的原理试什么

马锦涛

1周前

32.4776 1 0
  • 关注作者
  • 收藏