定義
交絡(confounding)は、2つ以上の要因が連動して変化するため、そのうちのどれが結果に影響しているのかを判断できない状態である。ある目的変数yへのある説明変数xの影響を知りたいシナリオを考える。交絡があるとは第3の変数(=剰余変数)の存在によりこの推定が妨げられる状態のことである。交絡が存在する状態は「要因が交絡している」とも表現される。
交絡因子には測定されているものと、測定されていないものがある。
交絡(confounding)とは、モデルの外側に目的変数と説明変数の両方に影響を与える変数が存在する状態と定義されることもある。これは未測定の交絡因子と考えられる。
交絡の制御方法
実験デザインによって交絡を制御する方法として(1)一定化 (2)バランス化 (3)ランダム化がある。
名称 | 具体的な操作 |
一定化 | 関心のない要因については全ての被験者が均質となるようにする(例えば性別を統制したい場合は、女性のみで研究を行うなど) |
バランス化 | 比較する各群において、関心のない要因については異なる条件の人が同数ずつ含まれるようにする(例えば性別であれば、男女等しい人数を各群に割り当てる) |
ランダム化 | 各被験者を無作為に群に割り当てる |
各制御方には以下のような欠点がある。
(1) 一定化:結果を他の母集団に一般化できない(上記例では女性での研究結果は男性にはあてはまらないかもしれない。)
(2) バランス化:バランス化対象以外の未知の説明変数の交絡を統制できない。
(3) ランダム化:実験を何度も何度も繰り返せば未知の説明変数を含めて統制できるが、一回の実験だけではバランス化されない可能性がある(たまたま全員女性の群と男性の群に分かれてしまう可能性がないとは言えない)
測定交絡の制御方法
交絡因子を測定している場合は、多変量解析やパス解析(SEM;構造方程式モデリング)などの統計手法によって交絡因子を制御できる。
未測定交絡の制御方法
未測定交絡は多変量解析では制御できない。そこで傾向スコア、操作変数法、感度解析などの統計学的手法が試みられている。しかし傾向スコア法に関しては、未測定交絡に対応できないことが近年明らかになっている。