共线性检查,你吃了多少vif
深圳这次转秋了,但还是想告诉北方的朋友,我们还穿着短袖~ ~
今天的主题是本周某一天在小组里发生的这样的对话。当时我是先说哑变量,再说悲哀,最后无意中提出了这个问题。
每个人的建模过程都差不多,所以这种讨论就发生在我在一次沙龙分享中遇到的时候,因为vif应该定义为多少diss的东西,细节未知,但vif还是需要解决。
所以今天想和大家分享这个话题。
首先,多重共线性是指看似独立的指标本质上是相同的,可以相互替代。他们用同样的内容反复分析同样的问题,讲同样的内容,也就是说,他们的一个变量可以代表所有的变量。此外,从数学角度来看,多重共线性会导致参数估计的误差,导致回归系数与数据相反。
其次,我们来看看vif的具体解释和计算公式:
这是基本的解释。现在我们可以用简单粗暴的话来说下微分展开因子vif的公式。我们可以看到,它的大小是由复决定系数决定的。复测定系数越大,vif越大。当时我们需要清楚知道的是复测定系数有多大,有多小,那么接下来我们要看的是复测定系数的公式:
也就是说,如果方程拟合得更好,那么复确定系数会更大,那么vif会越来越大,超过某个阈值,这就意味着存在多重共线性,那么这时候我们就回到刚才提出的问题,根据聊天记录是2,3,6,还是根据某些书籍是10。
结论:
这里需要提到的是,在计量经济学中,伍德里奇的书中说,当使用微观数据,样本量相对较大时,绝对系数可以很小,但这并不意味着模型差。所以有人认为vif大于2,有人认为大于10就是标准,这和你建模的数据量有关。当你有大量数据时,你可以采用较小的vif,当你有少量数据时,你可以采用较大的vif。建议是,如果你的样本数据是千,大概5000-10000个样本,你可以取6-10的vif,达到100000,你可以取2-5的vif。建议保险起见,可以再看看相关矩阵。以免不必要的偏差。
1.《VIF 共线性检查,你的vif取了多少》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《VIF 共线性检查,你的vif取了多少》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/983476.html