エラーバー(error bars)

定義

エラーバー(error bars)とは、統計学的推定における不確実性を視覚的に表現する方法1つである。伝統的に頻用される図であるが、その解釈は非直観的なものであり、取扱には注意を要する。

エラーバーの種類

エラーバーには3つの種類がある。それぞれ表現しているものが違う。

(1)標準偏差(s.d.)

(2)平均の標準誤差(s.e.m)

(3)信頼区間(CI)

目前のグラフのエラーバーが上記のどれかを明確に意識しないと解釈を誤まる。

典型的な間違いは、エラーバーを見ればどんなエラーバーであっても、エラーバーが重なっていない=統計学的有意差有り、エラーバーの重なっている=統計学的有意差なし、と解釈することである。エラーバーの重なりが意味するところはエラーバーの種類によって異なる。(上記のように解釈可能なエラーバーを作成するためには、83%CIバーを使用する方法がある。)

上記3種類のエラーバーの意味するところは以下の通りである。

(1) 新しい標本を抽出した場合の範囲の予測を示す

(2) 平均の不確実性およびその不確実性のサンプルサイズへの依存を示す (s.e.m = s.d. / √n)

(3) 測定の信頼性を示す区間推定を示す

s.e.mと信頼区間の関係

s.e.mと95%信頼区間はt-statisticを介して関連しており、大標本であればs.e.mは67%CIと解釈することができる。

CIのサイズは標本数nに依存する。記憶に値する近似式として以下のものがある。

(n=3の時) 95%CI≒4xs.e.m、(n>15の時) 95%CI≒2xs.e.m

図例

下記参考文献よりエラーバーの理解に役立つ図を引用する。

図1:(a)エラーバーとして見た目は同じであるが種類が違う場合に意味するp値の違い。(b)p値=.05の場合の各種類のエラーバーの表現の違い。

図2:(a)標本平均(95%信頼区間付き)を20回計算した例。(b)標本数増大に伴うs.e.mと95%CIの関係。

図3:頻用されるp値に相当するs.e.mエラーバーと95% CI エラーバーの対比(n=10、標本平均0と1の例)

 

参考

Error bars - Nature Methods
The meaning of error bars is often misinterpreted, as is the statistical significance of their overlap.

コメント