ハザード (hazard)

同義語

離散時間ハザード確率(離散時間データの場合)

定義

ハザードの定義は、離散時間データと連続時間データで異なる。離散時間におけるハザードは離散時間ハザード確率であり、連続時間におけるハザードは連続時間ハザードである。

離散時間データにおけるハザード

離散時間データにおけるハザードとは、ある個人iが期間jより前にイベントを経験していない場合に、期間jでイベントを経験する条件付き確率である。数式では以下のように表現される。

h(tij) = Pr [Ti = j | Ti >= j]

離散時間ハザードは実データに基づき以下のように推定される。

h_hat(tij) = n eventsj / n at riskj(= 期間jにおけるイベント数 / 期間jにおけるnumber at risk数)

連続時間データにおけるハザード

連続時間データにおけるハザードとは、ある個人iが期間jより前にイベントを経験していない場合にイベント発生時間が間隔[tj, tj +⊿t)に入る条件付き確率を、⊿tで割った率である。(⊿tは極小の時間を意味する。)

h(tij) = lim ⊿t->0 { Pr [Tiが間隔(tj,tj+⊿t)に入る | Ti >= tj] / ⊿t}

統計モデル上は、確率は0~1の値を取るのに対して、率は0以上で上限がないという違いが問題になる。

関連

ハザード関数

離散時間ハザード関数

連続時間ハザード関数

コメント