赵娜0418

2020-11-23   阅读量: 1032

统计学

如何处理冗余?

扫码加入数据分析学习群

问题详述:如何处理冗余?


解答:

在进行逻辑回归时,我们希望选择的变量尽可能地有效,避免冗余。常用的变量筛选方法有如下几种:

① Wald检验:通过Wald统计量,来检验自变量对因变量的影响能力。Wald越大,说明自变量的相关性越大,越应该保留。

② 似然比检验(Likehood Ratio):也是逻辑回归非常常用的一种检验方法。逻辑回归模型的估计一般是使用最大似然估计,也就是说找到一个似然函数L,使其达到最大值。L越大,也就说明模型的预测效果越好。因此似然比检验本质上是对包含或者不包含某一个或者几个变量的模型L值进行比较,从而做出判断。

③ 比分检验(Score Test):以包含某个或者某几个变量的模型作为基础,加入系数为0的新变量,通过计算似然函数的一阶偏导数和信息矩阵,取两者的乘积作为最终的统计量。

这三种方法中,似然比检验是最可靠,也是最常用的一种变量筛选方法。在变量存在共线性时,Wald检验结果不可靠。另外,实际应用是以上三种方法,都可以采用向前或者向后逐步的方式进行变量筛选。


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
36.8902 2 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子