VIF(variance inflation factor)

同義語

分散拡大要因(variance inflation factor ; VIF)

定義

VIF(X[i]) = 1/(1 – R[i]^2)

VIF(variance inflation factor)は多重共線性(multicollinearity)の評価に使用される尺度の1つである。

R[i]は1つの説明変数X[i]をその他の予測変数で回帰した(モデル式で記述すればXi~その他の変数)際の相関係数である。

重回帰分析では説明変数が複数あるため、全てのX[i]についてR[i]を計算する。即ち予測変数を順次1つずつ選び、それを他の予測変数で回帰することを繰り返す。

VIFは10を閾値とすることが多い。即ち、VIF > 10であれば、多重共線性が発生している=回帰係数を解釈すべきでないと解釈する。この場合、当該の説明変数をモデルから除去しモデルを再構築することが合理的な対処法である。

相関係数による基準

多重共線性の回避のためには、説明変数の総当りの相関係数行列を算出し、相関係数の絶対値がある閾値以上であれば、その組みあせのいずれか一方の説明変数をモデルから除去するという操作を行うこともある。この場合の相関係数の閾値としては0.8~0.95程度を使用することが多い。

関連

多重共線性(multicollinearity)

tolerance (VIFの逆数)

参考

Regression diagnostics - Nature Methods
Residual plots can be used to validate assumptions about the regression model.

コメント