读童话的狼

2020-08-30   阅读量: 68

统计学

如何解决线性模型变量相关性问题的讨论

首先要明确一点:变量之间的相关性(只要不是完全相关)是不会影响参数的一致性的。

那么会影响什么呢?影响的是参数估计的方差。

所以,如果你的样本足够大,变量间的相关性不是什么大问题,甚至压根就不是问题。

那么如果你的样本没那么大,该怎么处理呢?这个时候就要看你做模型的目的了。

简单的区分的话,你究竟关注相关,还是因果,甚至只是想预测?


如果你是关注因果,那么不好意思,这个问题没有办法。比如如果在经济学里面,你如果删掉任何一个变量,都会导致遗漏变量而产生偏误,这个时候你的系数估计是不一致的。

如果仅仅是关注相关,那么主成分分析等是个好的方法。此外如果你觉着有一些系数应该为0,甚至还可以LASSO。

如果你是想预测,那么虽然多重共线性导致系数估计方差变大,但是预测能力不会有所降低,所以这个问题没有那么值得去处理。


参考:https://www.zhihu.com/question/27974196

41.4359 2 0 关注作者 收藏

评论(0)


暂无数据

推荐帖子

推荐课程