[R]{survival}cluster() : 生存時間分析のモデル式の右辺の中でクラスター(相互関連する観察データのグループ)を指定する関数

説明

cluster()は生存時間分析の文脈で、モデル式の右辺の中でクラスター(=相互関連する観察データのグループ)を指定する関数である。モデル式中でcluster()を使用することは、頑健サンドイッチ分散推定(robust sandwich variance estimators)が必要であることを意味する。

例えば、time dependent covariateを含む生存時間データでは同一人物に関するレコードが複数行含まれることになる(それぞれが別の時間間隔 time intervalに対応する)。このような場合にcluster()を使用して、同一人物のレコードは同一人物のものであることを明示するのである。

使用法

cluster(x)

引数

x : 文字列型、因子型、あるいは数値型の変数

詳細

cluster()の機能は純粋に意味的(sementic)なものである。即ちある変数がクラスターインディケータ(cluster indicator)であることを明示するだけである。結果として得られる分散はGEEモデルにおける “working independence” variance として知られている。

frailty term とクラスター項(cluster term)を同一のモデル内に混在させることはできない。なぜならfrailty項は共分散に対する混合効果モデル(mixed-effects approach)によるアプローチであり、クラスター項はGEEモデルによるアプローチだからである。

返り値

x

コメント