詹惠儿

如何理解方差分析中组间方差和组内方差?

问:如何理解方差分析中组间方差和组内方差?答:• 如果因素A的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接近0• 如果不同水平对结果有影响,组间方差就会大于0,组间方差与组内方差的比值就会大于0• 当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对结果有显著影响。 其中,两者的公式为:

0.1377 1 0
  • 关注作者
  • 收藏
詹惠儿

两个总体均值比较小结

问:两个总体均值比较小结答:1、判断是否来自正态总体(直方图)。2、正态分布时,检验两个总体的方差是否相等( F检验); • 方差相等时采用等方差的t检验; • 方差不相等时采用不等方差的t检验。3、非正态分布、大样本时采用z检验。

0.1377 1 0
  • 关注作者
  • 收藏
马锦涛

如何用Python解决蒙特霍尔三门问题

游戏规则:参赛者会看见三扇关闭的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门就可以赢得该汽车,另两扇门后则各藏有一只山羊。当参赛者选定了一扇门,但未去开启它的时候,知道门后情形的节目主持人会开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参赛者要不要换另一扇仍然关上的门。概率求解(python实现):import randomdef MontyHall(Dselect, Dchan

0.0633 1 0
  • 关注作者
  • 收藏
马锦涛

什么是频率?什么是概率?

频率定义:在相同条件下,进行n次试验,在这n次试验中,事件A发生的次数,称为事件A发生的频数,比值:f = 频数/试验次数,称为事件A发生的频率。基本性质:(1)0

38.5642 2 0
  • 关注作者
  • 收藏
马锦涛

什么是随机事件?什么是事件?什么是基本事件?

随机试验:(1)相同条件下可重复 (2)实验结果不止1个 (3)结果无法预测 (4)用E表示 事件:每种结果叫做事件。 随机事件:指在一定条件下可能发生也可能不发生的事件。应该注意的是,事件的结果是相应于"一定条件"而言的。因此,要弄清某一随机事件

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

什么是克莱姆法则?

克莱姆法则是一种求解线性方程组的方法,大多数线性代数教材都会提到。例如对于如下的线性方程组:运用克莱姆法则,这个方程组的解可以如下: 其中,分别是如下三个行列式:, ,对于更一般的情况:解可以由同样的公式给出:其中的,,是将矩阵的第i纵列换成向量b之后得到的矩阵。可以看出,这些表达式只有在存在并且不等于0的时候才是有意义的,这点只有在有效方程数等于未知数的个数的时候才能得到保证。记得使用时把公式记

38.5009 1 0
  • 关注作者
  • 收藏
马锦涛

定序型和定距型是什么?

1、定比数据:表现为数值,可以进行加、减运算以精确计算数据。比如身高、体重等 定距数据:表现为数值,有单位,可以做加减运算,不能做乘除运算。比如,温度。 定类数据:按事物某种属性分类或分组,数字大小代表类别。比如性别(男和女)。 定序数据:数据的中间级,用数字表示个体在某个有序状态中所处的位置,不能做四则运算。比如您对天猫的满意情况如何?(非常不满意、比较不满意、中立、比较满意、非常满意)

0.0000 0 0
  • 关注作者
  • 收藏
赵娜0418

如何处理冗余?

问题详述:如何处理冗余?解答:在进行逻辑回归时,我们希望选择的变量尽可能地有效,避免冗余。常用的变量筛选方法有如下几种:① Wald检验:通过Wald统计量,来检验自变量对因变量的影响能力。Wald越大,说明自变量的相关性越大,越应该保留。② 似然比检验(Likehood Ratio):也是逻辑回归非常常用的一种检验方法。逻辑回归模型的估计一般是使用最大似然估计,也就是说找到一个似然函数L,使其达

36.8902 2 0
  • 关注作者
  • 收藏
赵娜0418

想用Python做频数分析应该如何做?

问题详述:想用Python做频数分析应该如何做?解答:导入相关库:导入数据:从具有Weibull Distribution的Weibull Distribution生成一维数据集其中U来自Uniform Distribution 。直方图通过使用直方图,我们可以将1D数据集正确地划分为具有特定大小或宽度的区间,从而形成离散的概率分布

36.9509 3 0
  • 关注作者
  • 收藏
赵娜0418

大样本的自相关可以用D-W检验吗?

问题详述:大样本的自相关可以用D-W检验吗?解答:自相关检验通常包括四种方法:1画残差自相关图(初步判断);2.BG检验;3.Q检验;4.DW检验。其中,楼主所说的DW检验是可以用来检验大样本自相关的。但其存在以下主要缺点:1.只能检验一阶自相关(楼上已经提到),且要求解释变量满足严格外生性;2.其检验统计量d依赖于数据矩阵(X),无法绘制统计表,必须借助上下限来判断。当然,即使得到了上下限的值,

36.8621 1 0
  • 关注作者
  • 收藏
赵娜0418

偏度应该如何理解?

问题详述:偏度应该如何理解?解答:偏度用来刻画偏态的程度。偏态有两种情况:一种是如图所示(左边)的左偏,该变量在负的方向部分严重拖尾;另一种是如图所示(右边)的右偏,在正的方向部分严重拖尾。在实际经济和商业数据分析中,右偏是比较普遍的状态。比如,地区的居民收入、客户购买产品的数量、金额和保险理赔额。

36.8621 1 0
  • 关注作者
  • 收藏
赵娜0418

行列式和矩阵说的是同一个概念吗?

问题详述:行列式和矩阵说的是同一个概念吗?解答:行列式与矩阵是两个东西,他们区别是:1. 矩阵是一个表格,行数和列数可以不一样;而行列式是一个数,且行数必须等于列数。只有方阵才可以定义它的行列式,而对于长方阵不能定义它的行列式。2. 两个矩阵相等是指对应元素都相等;两个行列式相等不要求对应元素都相等,甚至阶数也可以不一样,只要运算代数和的结果一样就行了。3.两矩阵相加是将各对应元素相加;两行列式相

36.8621 1 0
  • 关注作者
  • 收藏
赵娜0418

老师上课所说的数据挖掘中的IV是什么意思?

问题详述:老师上课所说的数据挖掘中的IV是什么意思?解答:1、IV的用途IV的全称是Information Value,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用一些方法,从这200个自变量中挑选一些出来,放进模型,形成入模变量列表

36.8621 1 0
  • 关注作者
  • 收藏
赵娜0418

检验中介效应是否存在?

问题详述:检验中介效应是否存在?解答:检验中介效应是否存在,其实就是检验A到B,B到C的路径是否同时具有有显著性意义。为了讲解更有效率,我们以最简单的模型为例,进行说明,如下如所示,图中路径上的符号代表路径系数(回归系数)。做中介效应检验的方法目前有四种:逐步回归法;系数乘积检验法;差异系数检验法和Bootstrapping。严格意义上来说,它们的分析原理都是一致的,检验W2和W3路径是否同时有意

36.8621 1 0
  • 关注作者
  • 收藏
赵娜0418

构建时间序列的影响因素是什么?

问题详述:构建时间序列的影响因素是什么?解答:1、长期趋势(Secular Trends)由于某种根本原因的影响,客观现象在一个相当长的时间内所呈现出来的持续增加或持续减少的一种趋势和状态。例如:随着经济条件、医疗条件的发展,人口出生率有高于死亡率的趋势;随着劳动条件和手段的改善,劳动生产率有上升趋势等。2、季节趋势(Seasonal fluctuation)由于季节的转变而使时间数列发生周期性变

46.2668 2 0
  • 关注作者
  • 收藏
赵娜0418

概率相关问题

生活案例英国超级联赛已经成为世界上最高水平的足球联赛之一,吸引了世界球迷的目光,曼彻斯特联队与曼彻斯特城队的同城德比更是令世界瞩目。截止到2015-2016赛季,曼彻斯特联队在历史上和曼彻斯特城队交手171次,打进250球丢234球,拿到了71胜51平49负的战绩。如果在2016-2017赛季,曼彻斯特联队与曼彻斯特城队将进行6场比赛,求曼联2胜1平3负的概率是多少?分析思路足球比赛的结果有胜、平

46.2668 2 0
  • 关注作者
  • 收藏
赵娜0418

类别不平衡的时候应该如何解决?

问题详述:类别不平衡的时候应该如何解决?解答:有些情况下训练集中的样本分布很不平衡,例如在肿瘤检测等问题中,正样本的个数往往非常的少。从线性分类器的角度,在用 y = wx +b 对新样本进行分类的时候,事实上在用预测出的y值和一个y值进行比较,例如常常在y>0.5的时候判为正例,否则判为反例。几率y/1-y反映了正例可能性和反例可能性的比值,阈值0.5恰好表明分类器认为正反的可能性相同。在样本不

46.2668 2 0
  • 关注作者
  • 收藏
赵娜0418

如何用函数对时间序列进行转换?

问题详述:如何用函数对时间序列进行转换?解答:时间序列对象是一种专为时间序列分析而设计的对象类型,其中包括两个维度,一个是描述指标的数值,还有一维是时间。时间序列对象和一般数值型向量类似,只不过是加了一个时间的描述。在R语言中可以使用ts(数据向量,frequency=表示将时间分开的时间间隔,start=c(第一个数据所表示的年,月))。详见下面的的例子。> sales.data

46.2668 2 0
  • 关注作者
  • 收藏
赵娜0418

无偏性、有效性和一致性如何区分理解?

问题详述:无偏性、有效性和一致性如何区分理解?解答:点估计是参数估计的重要组成部分,点估计的常见方法有矩估计和极大似然估计,衡量一个点估计量的好坏的标准有很多,比较常见的有:无偏性(Unbiasedness)、有效性(Efficiency)和一致性(Consistency)。由于抽样具有随机性。每次抽出的样本一般都不会相同,根据样本值得到的点估计的值也不尽相同。那么,如何来确定一个点估计的好坏呢?

46.2668 2 0
  • 关注作者
  • 收藏
读童话的狼

某城市想要估计市民中对于某提议的支持情况,随机地抽取了 400 名市民,其中 260 名表示支持该提议。请以 95%的置信水平估计该城市市民支持该提议比例的置信区间。

某城市想要估计市民中对于某提议的支持情况,随机地抽取了 400 名市民,其中 260 名表示支持该提议。请以 95%的置信水平估计该城市市民支持该提议比例的置信区间。根据统计学教材总体比例的置信区间的计算公式,可以得到上述题目的结果为:260/400加减1.96*sqrt(0.65*(1-0.65)/400)计算得到置信区间为(60%,70%)

19.6580 3 0
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
ermutuxia
20081.4306
02
赵娜0418
8220.0651
03
詹惠儿
6704.7217
04
liting李
4040.3540
05
LXM21
2376.1543
06
读童话的狼
1714.7376
07
PGC123
1480.3813
08
马锦涛
1047.6925
09
Dragon男爵
623.3936
10
235239
598.4692
11
17国本二
583.1929
12
心盛待花开
565.2293
13
樊江龙
501.6627
14
闪呀闪
435.3966
15
孙媛呀
418.1414
16
wangxishi
414.6179
17
18192654262
284.1543
18
SUKI-ZY
228.3905
19
85691082
220.7702
20
Sasyo
209.4047
21
永洪科技
173.3812
22
15119939905120
156.9421
23
Mosquito-
150.0168
24
yaolily
138.0199
25
16637023243
124.3920
26
r1cky
120.8189
27
白璐123
99.5190
28
野娃子
99.5190
29
Chin。
95.4506
30
BOBOLEYOUYOU
81.1556
31
hunter.Z
77.4616
32
杨谋
74.9150
33
kgdpesai
73.6167
34
1027670370
65.7718
35
wanghuijie2222
65.3341
36
soulspirits
50.5485
37
CDA-18810556009
45.3245
38
骆逸铭
42.4651
39
yw172716
40.5263
40
icey小媛
40.0812
41
我是大魔王哈哈
40.0623
42
刘圣杰
37.8449
43
CDA-13917481347
37.4575
44
星!
36.8621
45
201701010305
35.3692
46
夏光军
35.3585
47
291294878
23.8664
48
-黄纬
2.1889
49
星野
1.6439
50
9047_1575431266
0.8079