偏相関係数と部分相関係数

定義

(単純)相関変数は2つの量的変数間の関係性を評価する指標である。

これに対し、偏相関係数と部分相関係数は、3つ以上の変数がある場合に、この中から取り出した2変数の相関係数であるが、2変数の単純相関係数ではなく、第3の変数の影響を除外して考えた2変数間の相関係数である。

3つの変数x, y, zがある状況を考える。

yからxの影響を除いた成分(=yをxで予測した時の残差)を y|xと記述する。

偏相関係数(yとzの偏相関係数)とは y|xとz|xの相関係数のことである。偏相関係数は残差と残差の相関係数とも言える。

部分相関係数(y|xとzの部分相関係数)とはy|xとzの相関係数のことである。

計算式

偏相関係数

ryz|x = ( ryz – rxyrxz ) / { SQRT(1-r2xy) SQRT(1-r2xz) }

偏相関係数の使用目的

偏相関係数は「第3の変数の影響を除くと、残る2変数間の相関はどうなるのか?」を知りたい時に使用する。

部分相関係数の使用目的

部分相関係数が利用される最も重要な場面は、重回帰分析における独立変数の選択である。

例えば、従属変数yに対して、最初の独立変数としてzが選ばれており、第2の独立変数としてxを追加すべきかどうかを検討する際には、yとx|z(xのうちzに含まれていない情報)の部分相関係数を考えて決定する。