赵娜0418

逻辑回归主要是用来做什么的?是做回归吗?

问题详述:逻辑回归主要是用来做什么的?是做回归吗?解答:错。逻辑回归是分类算法,不要被它的名字给迷惑了。很多时候看到这个名字会被名字误导,以为是回归算法,实际上逻辑回归是处理分类问题的。

32.1601 3 0
  • 关注作者
  • 收藏
赵娜0418

错误率越大则权重越大,分类误差小的分类器有更大的权重,这两个矛盾吗?

一、问题描述错误率越大则权重越大,分类误差小的分类器有更大的权重,这两个矛盾吗?二、问题解答第一个是针对样本来说的,如果样本的错误率越大,则有更大的权重。后一个是针对分类器来说的,如果一个分类器的误差小,则给他更大的权重,否则分类误差大,就给小的权重。

31.5516 1 0
  • 关注作者
  • 收藏
赵娜0418

ARMA和ARIMA的区别是什么?

问题详述:老师 ARMA和ARIMA不是一回事吧?解答1、运用对象不同AR,MA,ARMA都是运用于原始数据是平稳的时间序列。ARIMA运用于原始数据差分后是平稳的时间序列。2、时间序列不同AR(自回归模型),AR ( p) ,p阶的自回归模型。MA(移动平均模型),MA(q),q阶的移动平均模型。ARIMA(差分自回归移动平均模型)。3、平稳性差别ARMA模型的平稳性要求y的均值、方差和自协方差

0.0000 0 0
  • 关注作者
  • 收藏
18192654262

如何判断是不是几何分布?

如何判断是不是几何分布?只要符合下面4个特点就可以判别你做的事情是不是几何分布了:1)做某事件次数(也叫试验次数)是固定的,用n表示(例如抛硬币3次,表白5次),2)每一次事件都有两个可能的结果(成功,或者失败)(例如每一次抛硬币有2个结果:正面表示成功,反面表示失败。每一次表白有2个结果:表白成功,表白失败)。3)每一次“成功”的概率都是相等的,成功的概率用p表示(例如每一次抛硬币正面朝上的概率

41.4092 3 0
  • 关注作者
  • 收藏
18192654262

什么是二项分布呢?

什么是二项分布呢?只要符合下面3个特点就可以判断某事件是二项分布了:1)做某件事的次数(也叫试验次数)是固定的,用n表示。(例如抛硬币3次,投资5支股票),2)每一次事件都有两个可能的结果(成功,或者失败)(例如每一次抛硬币有2个结果:正面表示成功,反面表示失败。每一次投资美股有2个结果:投资成功,投资失败)。3)每一次成功的概率都是相等的,成功的概率用p表示(例如每一次抛硬币正面朝上的概率都是1

41.2855 2 0
  • 关注作者
  • 收藏
宋俊花

逻辑回归为什么要对特征进行离散化

在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、1特征交给逻辑回归模型,这样做的优势有以下几点:0. 离散特征的增加和减少都很容易,易于模型的快速迭代;1. 稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展;2. 离散化后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大

40.3583 2 0
  • 关注作者
  • 收藏
读童话的狼

如何解决线性模型变量相关性问题的讨论

首先要明确一点:变量之间的相关性(只要不是完全相关)是不会影响参数的一致性的。那么会影响什么呢?影响的是参数估计的方差。所以,如果你的样本足够大,变量间的相关性不是什么大问题,甚至压根就不是问题。那么如果你的样本没那么大,该怎么处理呢?这个时候就要看你做模型的目的了。简单的区分的话,你究竟关注相关,还是因果,甚至只是想预测?如果你是关注因果,那么不好意思,这个问题没有办法。比如如果在经济学里面,你

41.4359 2 0
  • 关注作者
  • 收藏
宋俊花

方差分析和回归分析 异同

方差分析和回归分析总体上都属于一个类别,一般线性模型(general linear model,GLM)。从数据类型来看,方差分析的因变量是连续型数据,自变量是分类变量,一般都以组别的形式出现。回归分析的因变量是连续型数据,自变量既可以是分类数据,也可以是连续型数据,也可以两种都有。具体来说:一、方差分析与回归分析的相同点1、方差分析与回归分析的变量都是两种或两种以上。2、方差分析与回归分析的结果

35.3721 2 0
  • 关注作者
  • 收藏
宋俊花

标准差与标准误

共同点标准差和标准误都在衡量一群“小点点”的变异程度/离散程度。不同点标准差(SD)的“小点点”是仅仅某一次抽样得到的一个「样本量为N」的样本里的所有个体(单个分数)标准误(SE)的“小点点”是很多次抽样得到的很多「样本量均为N」的样本(样本的某种统计量,如平均值、回归系数等)一言以蔽之(以平均值为例,这是最简单的理解)标准差 = 一次抽样中个体分数间的离散程度,反映了个体分数对样本均值的代表性,

35.3721 2 0
  • 关注作者
  • 收藏
叶yyf

推断性分析方法

列联分析——分析定性变量对定性变量的影响原理:比较实际值与期望值(如何计算?)之间的差距,构造了卡方统计量,进行决策作用:通过比较实际值与期望值之间是否存在差异,分析定性变量对另一个定性变量是否有显著影响。——拟合优度检验、独立性检验、......几个系数——消除n的影响方差分析——分析定性变量对定量变量的影响原理:比较组间误差(存在随机误差+可能有因素A的影响)与组内误差(只有随机误差)

35.3721 2 0
  • 关注作者
  • 收藏
LXM21

定比和定距的区别

1.定距数据(Interval):具有间距特征的变量,有单位,没有绝对零点,可以做加减运算,不能做乘除运算。例如,温度。2.定比变量(Ratio):数据的最高级,既有测量单位,也有绝对零点,例如职工人数,身高。

44.8761 3 0
  • 关注作者
  • 收藏
LXM21

评估系数

这个评估系数是之前统计学的,置信区间要求是95%,得到的5%吗?跟P值是一个意思嘛答:不一样,意思是显著性水平α=5%,就是α=0.05,跟相应的P值比较看结果是否显著

44.6016 2 0
  • 关注作者
  • 收藏
宋俊花

回归算法选择汇总

基于x,y 变量类型以及多少的时候,应该选择哪种回归模型和算法:

126.7985 6 0
  • 关注作者
  • 收藏
liting李

一般正态分布与标准正态分布的区别与联系

正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。

48.4274 6 0
  • 关注作者
  • 收藏
1027670370

统计是什么?

统计是处理数据的一门科学。人们给统计学下的定义很多,比如,“统计学是收集、分析、表述和解释数据的科学”;“统计是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论”。综合地说,统计学(statistics)是收集、处理、分析、解释数据并从数据中得出结论的科学。统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法,

38.1193 6 0
  • 关注作者
  • 收藏
zhongxn

卡方分箱

分箱的原因:1、模型稳定:在一般情况下建立分类模型是,需要对连续变量进行离散化,离散后的特征能够去除噪声,对异常值不再敏感,使得模型可以更加的稳定。2、简化模型:降低样本中的个别信息对模型的影响,降低过拟合的风险。分箱的目的:1、离散特征的增加和减少很容易,易于模型的快速迭代。2、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展。3、列表内容离散化后的特征对异常数据有很强的鲁棒性。【离散化后

37.4817 3 0
  • 关注作者
  • 收藏
zhongxn

卡方分箱

分箱的原因:1、模型稳定:在一般情况下建立分类模型是,需要对连续变量进行离散化,离散后的特征能够去除噪声,对异常值不再敏感,使得模型可以更加的稳定。2、简化模型:降低样本中的个别信息对模型的影响,降低过拟合的风险。分箱的目的:1、离散特征的增加和减少很容易,易于模型的快速迭代。2、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展。3、列表内容离散化后的特征对异常数据有很强的鲁棒性。【离散化后

37.4817 3 0
  • 关注作者
  • 收藏
liting李

为什么要对相关系数进行显著性检验?

原因:所有的假设检验都是要分析显著性的,拿相关系数来说,我们虽然求得了相关系数值,但是这个相关系数有没有统计学意义呢?换句话说,我们看到的这个相关系数是确实存在呢?还是说只是抽样误差导致的?显著性检验就是要解决这个问题的,如果显著,则表明相关的确存在,不是抽样误差导致的。

37.5676 4 0
  • 关注作者
  • 收藏
k_0711

分支语句

分支语句顾名思义,就是像岔路口一样,选择不同的路就会有不尽相同的结果,分支语句体现一种选择的思维。分支语句的语法如下:单分支:if(条件1):语句块如果条件1为真则执行语句块,否则不执行语句块。二分支:if(条件):语句块1else:语句块2这个表示若条件为真执行语句块1,否则执行语句块2或者:(表达式1) if (条件) else (表达式2)这个是更为简洁的二分之表达方式,若第二个括号中的条件

41.2325 2 0
  • 关注作者
  • 收藏
1027670370

统计数据的整理

一、统计数据整理 统计数据整理是统计数据调查的继续和数据分析的前提,是感性认识上升到理性认识的连接点。数据整理的前提是审核,分组汇总是核心。按品质变量分组的关键是界定各类型组的性质差异,按数值变量分组的关键是正确确定各组的数量界限,即组数与组限。二、统计分组 统计分组必须遵循穷尽性和互斥性两个原则。数值变量分组有单项式和组距式两种。组距式分组又有离散型与连

41.4053 6 0
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
ermutuxia
18050.9966
02
赵娜0418
8220.0018
03
詹惠儿
5634.1005
04
liting李
3557.6643
05
LXM21
2048.8002
06
读童话的狼
1556.0868
07
PGC123
1423.2125
08
马锦涛
665.9046
09
17国本二
583.1296
10
心盛待花开
564.8754
11
樊江龙
501.3231
12
235239
470.6942
13
Dragon男爵
420.0004
14
闪呀闪
396.8957
15
wangxishi
362.5866
16
孙媛呀
301.3826
17
SUKI-ZY
228.3676
18
85691082
220.6917
19
Sasyo
209.4047
20
永洪科技
173.1457
21
15119939905120
156.9421
22
Mosquito-
149.8338
23
16637023243
124.3920
24
r1cky
120.8189
25
Chin。
95.4506
26
BOBOLEYOUYOU
81.1556
27
hunter.Z
77.4616
28
杨谋
74.9150
29
kgdpesai
73.6167
30
1027670370
65.7718
31
wanghuijie2222
65.3341
32
soulspirits
50.5485
33
CDA-18810556009
45.3245
34
骆逸铭
42.4651
35
yw172716
40.5263
36
icey小媛
40.0812
37
我是大魔王哈哈
40.0623
38
刘圣杰
37.8449
39
CDA-13917481347
37.4575
40
星!
36.8621
41
201701010305
35.3692
42
夏光军
35.3585
43
18192654262
35.3568
44
291294878
23.8664
45
-黄纬
2.1889
46
星野
1.6439
47
9047_1575431266
0.8079
48
刘思婵
0.7200
49
开花结果02
0.4135
50
k_0711
0.4009