説明
cluster()は生存時間分析の文脈で、モデル式の右辺の中でクラスター(=相互関連する観察データのグループ)を指定する関数である。モデル式中でcluster()を使用することは、頑健サンドイッチ分散推定(robust sandwich variance estimators)が必要であることを意味する。
例えば、time dependent covariateを含む生存時間データでは同一人物に関するレコードが複数行含まれることになる(それぞれが別の時間間隔 time intervalに対応する)。このような場合にcluster()を使用して、同一人物のレコードは同一人物のものであることを明示するのである。
使用法
cluster(x)
引数
x : 文字列型、因子型、あるいは数値型の変数
詳細
cluster()の機能は純粋に意味的(sementic)なものである。即ちある変数がクラスターインディケータ(cluster indicator)であることを明示するだけである。結果として得られる分散はGEEモデルにおける “working independence” variance として知られている。
frailty term とクラスター項(cluster term)を同一のモデル内に混在させることはできない。なぜならfrailty項は共分散に対する混合効果モデル(mixed-effects approach)によるアプローチであり、クラスター項はGEEモデルによるアプローチだからである。
返り値
x
コメント