[R]{survival}cluster() : 生存時間分析のモデル式の右辺の中でクラスター（相互関連する観察データのグループ）を指定する関数

説明
使用法
引数
詳細
返り値

説明

cluster()は生存時間分析の文脈で、モデル式の右辺の中でクラスター（＝相互関連する観察データのグループ）を指定する関数である。モデル式中でcluster()を使用することは、頑健サンドイッチ分散推定（robust sandwich variance estimators）が必要であることを意味する。

例えば、time dependent covariateを含む生存時間データでは同一人物に関するレコードが複数行含まれることになる（それぞれが別の時間間隔 time intervalに対応する）。このような場合にcluster()を使用して、同一人物のレコードは同一人物のものであることを明示するのである。

使用法

cluster(x)

引数

x ：文字列型、因子型、あるいは数値型の変数

詳細

cluster()の機能は純粋に意味的(sementic)なものである。即ちある変数がクラスターインディケータ（cluster indicator)であることを明示するだけである。結果として得られる分散はGEEモデルにおける “working independence” variance として知られている。

frailty term とクラスター項(cluster term)を同一のモデル内に混在させることはできない。なぜならfrailty項は共分散に対する混合効果モデル(mixed-effects approach)によるアプローチであり、クラスター項はGEEモデルによるアプローチだからである。

説明

使用法

引数

詳細

返り値

コメント