交絡要約スコア(confounder summary score)

定義

交絡要約スコア(confounder summary score)とは、複数の交絡因子の情報を要約した1つのスコア(要するに1つの合成変数)のことである。

交絡要約スコアを使用するメリット

交絡要約スコアのメリットは2つある。
(1) データの中にほとんどアウトカムイベントがなくても、多くの交絡因子を制御できる
(2) 外れ値の被験者を除外できる(trimmingと呼ばれる手法)

個々の交絡因子をそのまま扱うと、予測変数が増えるため、統計モデルのオーバーフィッティングが起こりやすい。この代わりに、1つの交絡要因スコアを計算し、それだけを回帰モデルに投入することによってオーバーフィッティングの問題をある程度回避できる。これが交絡要約スコアを使用するメリット(1)である。

交絡要約スコアを使用する場合、曝露群と非曝露群でマッチングがなされるが、あまりにも外れた値の交絡要約スコアを持つ症例はマッチングに使用されない。結果的に外れ値をtrimmingした効果が得られる。これがメリット(2)である。

交絡要約スコアの分類

交絡要因スコアには(1) 疾病スコア (disease risk score)、(2) 傾向スコア(propensity score)の2つがある。

(1) 疾病スコア (disease risk score)は疾病リスクを交絡因子で予測した予測値である。

(2) 傾向スコア(propensity score)は曝露リスクを交絡因子で予測した予測値である。曝露要約スコアとも呼ばれる。

関連

[R]{MatchIt} 傾向スコアマッチングを実施する方法