[latexpage]
定義
共分散分析モデルは、説明変数に量的変数と質的変数の両方を含む一般線形モデルである。
実際の共分散分析では、質的変数に主たる関心があり、量的変数は統制されるべき変数(=剰余変数)とみなされることが多い。即ち、各群の回帰直線の傾きは等しいと仮定して(=剰余変数の統制)、群の効果(=質的変数の効果)を切片の差異として検定することになる。
共分散分析の文脈では、剰余変数は「共変数(covariate)」または「共変量」と呼ばれることが一般的である。
共分散分析は、回帰分析と分散分析を同時に行う手法と呼ばれることもある。
共分散分析は以下のモデル式で表現される統計モデルである。
$${Y_{ij}} = \mu + {a_j} + {x_{ij}}b + {x_{ij}}{(ab)_j} + e{}_{ij}$$
yij : j群に割り当てられたi番目の被験者の特性値、xij:yijに対する共変量、μ:全体平均、aj:j群の要因の効果、b:全ての群の平均的な回帰係数、(ab)j:要因と共変量の交互作用、eij:誤差
共分散分析の手順
共分散分析では「共変数の影響が群間で等しい」という仮定を置いている。従って共分散分析の実際においては、まず交互作用の検定を行いこの仮定が成立しているかをチェックする必要がある。成立していればデータ全体に対して共分散分析が可能である。成立していなければ、データを群分けして各群ごとに回帰分析を行うことになる。
1.交互作用の検定(=回帰係数の等質性の検定)を行う。H0:回帰係数が全て平行である(=回帰係数が等質である)。
2.帰無仮説が採択されたら → 交互作用項のないモデル式を使って要因の検定を行う
3.帰無仮説が棄却されたら → 群ごとの回帰分析を行う
[R]での解析手順
# Rでは通常の多変量解析と同じモデル式で表現可能である。
# 共分散分析を実行するには3つのモデルが必要である。
fit1 <- aov(目的変数 ~ 共変数, data=データフレーム名) # 各水準において切片、傾きいずれも等しい
fit2 <- aov(目的変数 ~ 共変数 + 説明変数, data=データフレーム名) # 各水準において切片のみ異なり、傾きは等しい
fit3 <- aov(目的変数 ~ 共変数 x 説明変数, data=データフレーム名) # 各水準において切片および傾きが異なる
# 交互作用の検定
anova(fit2,fit3)
# 上記でfit2とfit3に有意差がない場合のみ、交互作用はないと考えて、主効果の分析に進む
anova(fit1,fit2)