信頼性 (reliability)

定義

信頼性とは、テスト理論において、検査得点が真の得点によって決定される程度、即ち検査得点が測定誤算によって左右されない程度のことである。以下の式で定義される。

信頼性=真の得点の分散/検査得点の分散

信頼性は0~1の値をとる。信頼性が1である時、テストは完全な信頼性を持つ。

なお、古典的テスト理論では、

検査得点=真の得点+測定誤差

と分解したモデルを想定している。

信頼性の推定値

真の得点そのものを知ることは不可能であるため、信頼性は何らかの方法で推定するしかない。

信頼性の推定値として「内的整合性信頼性(internal consistency reliability)」、「再テスト信頼性(test-retest reliability)」、「評者間信頼性」(inter-rater reliability)などがある。

内的整合性信頼性は、同一尺度に含まれる項目間の検査得点の相関である。

再検査信頼性、再テスト信頼性 (test-retest reliability)は、同一対象の複数時点で検査得点の相関である。

採点者間信頼性 (inter-rater reliability)は、同一対象の複数評価者による検査得点の相関である

信頼性の推定値と対応する指標

信頼性の種類指標意義と解釈
内的整合性信頼性クロンバックα係数古典的テスト理論における内的整合性の指標。

0-1の範囲を取る。1に近いほどよい。

0.7以上で十分と考えることが多い。

内的整合性信頼性ω係数因子分析の枠組みによる内的整合性の指標。

0.7以上で十分と考えることが多い。

α係数よりもよい数字が出る。

再テスト信頼性ICC(級内相関係数)0.7以上で十分と考えることが多い。

関連

[R]{psych} alpha() :クロンバックαなど信頼性の指標を出力する

[R]{psych} ICC()で級内相関係数を計算する方法:どんな形式のデータを渡せばいいのか?

コメント