信頼性 (reliability)

定義

信頼性とは、テスト理論において、検査得点が真の得点によって決定される程度、即ち検査得点が測定誤算によって左右されない程度のことである。以下の式で定義される。

信頼性＝真の得点の分散／検査得点の分散

信頼性は0~1の値をとる。信頼性が1である時、テストは完全な信頼性を持つ。

なお、古典的テスト理論では、

検査得点＝真の得点＋測定誤差

と分解したモデルを想定している。

真の得点そのものを知ることは不可能であるため、信頼性は何らかの方法で推定するしかない。

信頼性の推定値として「内的整合性信頼性(internal consistency reliability)」、「再テスト信頼性(test-retest reliability)」、「評者間信頼性」(inter-rater reliability)などがある。

内的整合性信頼性は、同一尺度に含まれる項目間の検査得点の相関である。

再検査信頼性、再テスト信頼性 (test-retest reliability)は、同一対象の複数時点で検査得点の相関である。

採点者間信頼性 (inter-rater reliability)は、同一対象の複数評価者による検査得点の相関である

信頼性の種類	指標	意義と解釈
内的整合性信頼性	クロンバックα係数	古典的テスト理論における内的整合性の指標。 0-1の範囲を取る。1に近いほどよい。 0.7以上で十分と考えることが多い。
内的整合性信頼性	ω係数	因子分析の枠組みによる内的整合性の指標。 0.7以上で十分と考えることが多い。 α係数よりもよい数字が出る。
再テスト信頼性	ICC(級内相関係数)	0.7以上で十分と考えることが多い。