wo5656500

什么是梯度下降?

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法。在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值。反过来,如果我们需要求解损失函数的最大值,这时就需要用梯度上升法来迭代了。在机器学习

wo5656500

2020-04-21

18.0306 2 6
  • 关注作者
  • 收藏

协方差为什么运算出来4个,而只取第二个?

x2和y1的协方差和x1和y2的协方差值一样,所以随机取了一个

wo5656500

2020-04-21

1.0133 1 4
  • 关注作者
  • 收藏

相关系数直接看大小不用管正负吗

需要,大小代表相关程度,正负号代表是正相关还是负相关关系

wo5656500

2020-04-21

1.2939 1 1
  • 关注作者
  • 收藏

为什么这三个是不显著的?

在进行t检验时,会计算出一个t值,而在选定显著性水平后,可以找到相比较的t值,两者可以比较,判断显著性。p值代表的是不接受原假设的最小的显著性水平,可以与选定的显著性水平直接比较。例如取5%的显著性水平,如果p值大于5%,就接受原假设,否则不接受原假设。

wo5656500

2020-04-21

1.2939 1 1
  • 关注作者
  • 收藏

这两种方式显示体重与时间的相关系数为什么不一样

第一种方法是斯皮尔曼相关系数公式求的,第二种方式默认求皮尔森相关系数

wo5656500

2020-04-21

1.2939 1 2
  • 关注作者
  • 收藏

正则化具体操作是怎么做的呢?

1)概念   L0正则化的值是模型参数中非零参数的个数。   L1正则化表示各个参数绝对值之和。   L2正则化标识各个参数的平方的和的开方值。 2)正则化后会导致参数稀疏,一个好处是可以简化模型,避免过拟合。因为一个模型中真正重要的参数可能并不多,如果考虑所有的参数起作用,那么可以对训练数据可以预测的很好,但是对测试数据就只能呵呵了。另一个好处是参数变少可以使整个模型获得更好的可解释性。 且参数

wo5656500

2020-04-21

1.2939 1 7
  • 关注作者
  • 收藏

出现异方差怎么处理?

解决异方差问题一般有三种办法,分别是数据处理(取对数)、Robust稳健标准误回归和FGLS法;三种办法可以同时使用去解决异方差问题。 1. 原数据做对数处理 针对连续且大于0的原始自变量X和因变量Y,进行取自然对数(或10为底对数)操作,如果是定类数据则不处理。 取对数可以将原始数据的大小进行‘压缩’,这样会减少异方差问题。事实上多数研究时默认就进行此步骤处理。负数不能直接取对数,如果数据中有

wo5656500

2020-04-21

1.2939 1 1
  • 关注作者
  • 收藏

导入数据提示unexpected EOF while parsing怎么解决?

这个问题说明路径有问题,检查一下小括号,引号,\\有没有漏写或者写错

wo5656500

2020-04-20

68.6047 3 2
  • 关注作者
  • 收藏

什么是过拟合?

过拟合(over-fitting),机器学习模型或者是深度学习模型在训练样本中表现得过于优越,导致在验证数据集以及测试数据集中表现不佳。出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少。 过拟合问题,根本的原因则是特征维度(或参数)过多,导致拟合的函数完美的经过训练集,但是对新数据的预测结果则较差。

wo5656500

2020-04-20

43.2510 4 3
  • 关注作者
  • 收藏

对于小数据来讲,有误差不是更加影响数据了吗,为什么小数据不考虑过拟合呢?

因为小数据通常是线性模型,线性模型不太可能会出现过拟合

wo5656500

2020-04-20

2.0563 2 2
  • 关注作者
  • 收藏

单样本t检验中这个3是什么意思?

这个3代表原假设中的期望值

wo5656500

2020-04-20

2.0563 2 3
  • 关注作者
  • 收藏

事后检验是用来干嘛的呢

事后检验是指将市场风险计量方法或模型的估算结果与实际发生的损益进行比较,以检验计量方法或模型的准确性、可靠性,并据此对计量方法或模型进行调整和改进的一种方法。若估算结果与实际结果近似,则表明该风险计量方法或模型的准确性和可靠性较高;若两者差距较大,则表明该风险计量方法或模型的准确性和可靠性较低,或者是事后检验的假设前提存在问题;介于这两种情况之间的检验结果,则暗示该风险计量方法或模型存在问题,但结

wo5656500

2020-04-20

3.6896 3 3
  • 关注作者
  • 收藏

提示seaborn中没有lineplot?

lineplot是seaborn自带的,报错很有可能是seaborn这个包损坏了,卸载这个包重新安装

wo5656500

2020-04-20

2.0563 2 2
  • 关注作者
  • 收藏

残差要以哪些方面来看呢

残差在数理统计中是指实际观察值与估计值之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话, 我们可以将残差看作误差的观测值。 它应符合模型的假设条件,且具有误差的一些性质。利用残差所提供的信息,来考察模型假设的合理性及数据的可靠性称为残差分析。 主要查看和检验的方法为:异常值检验、方差齐性检验、误差的正态性检验、相关性检验以及相伴随的方差稳定化变换,正态化变换等修正方法.

wo5656500

2020-04-20

3.6896 3 1
  • 关注作者
  • 收藏

KNNImputer填补是根据什么规则?

这个包是根据KNN算法,计算相近距离划分为最近的那一类,再进行填充

wo5656500

2020-04-20

2.9896 2 1
  • 关注作者
  • 收藏

t检验中equal_var这个参数是什么意思?

当两总体方差相等时,即具有“方差齐性”,可以直接检验  不拒绝原假设——两总体均值相等 如果两总体不具有方差齐性,需要加上参数equal_val并设定为False。

wo5656500

2020-04-20

67.6777 4 3
  • 关注作者
  • 收藏

协方差为0是两个随机变量独立的必要条件吗?

不是一回事. 协方差为0则不相关 独立一定不相关,但是不相关不一定独立. a为0到2pi上的随机值,X=cosa,Y=sina,则X和Y的协方差为0,但是X,Y两者不独立.

wo5656500

2020-04-17

3.9304 1 2
  • 关注作者
  • 收藏

不放回抽样,是不是也导致相关性

只能说是存在这种情况,但是不能肯定

wo5656500

2020-04-17

3.9304 1 2
  • 关注作者
  • 收藏

回归模型假设那么多条件,不满足一条怎么办

1. 模型建立正确 what?模型建立正确是进一步研究分析模型的基础,这是大前提,严格说不属于假设,不过很重要。 why?第一,在做回归分析前,需要先做相关分析。即使是不相关的杂乱无章的数据,也可以求得回归方程,但是是否显著、是否有意义就未知,所以需要先确保存在相关才能进行回归分析。第二,需要考虑经济意义,通过研究经济理论、选择合理的变量及函数、收集整理统计数据而建立的。因为回归分析结果和检验结

wo5656500

2020-04-17

3.9304 1 4
  • 关注作者
  • 收藏

这里的t分布自由度为什么是n-2?

因为n-k-1,k=自变量个数

wo5656500

2020-04-17

3.9304 1 3
  • 关注作者
  • 收藏
<123414>