多重共線性(multicollinearity)

同義語

マルチコ

定義

多重共線性(multicollinearity)とは、重回帰分析において予測変数間の相関が高すぎる状態のことである。

多重共線性を含む直線回帰モデルでは、その予測値は安定しているが、回帰係数の推定量が不安定(大きさや時に符合も変わる)となることが知られている。回帰係数の推定量が不安定であるとは、その標準誤差が大きくなることを意味する。回帰係数が収束せずに推定できない場合もある。

実際には、違うデータセットに対して同一のモデルをあてはめた際に、データセットごとに回帰係数の推定値が全く異なった値をとるという問題が生じる。このようなモデルが全く信頼できないものであることは言うまでもない。

解析中のモデルにおいて多重共線性が発生しているかどうかを評価する指標として、VIF(variance inflation factor)やtolerance(VIFの逆数)などがある。実際の統計モデリング作業においてはこれらの指標をルーチンに評価し、マルチコを防止する配慮が望ましいと考える。

対応策

独立変数間の意味や相関行列の吟味を行い、

(1) 不要な変数をモデルから取り除く

(2) 複数の変数をまとめた合成変数を作成し、これを独立変数として用いる