箱ひげ図(box plots)

定義

箱ひげ図(box plots)はデータの分布を視覚的に表現する図の1種である。

箱ひげ図では以下の数値が表現される。

25th パーセンタイル=lower quartile (Q1)
50th パーセンタイル=median (Q2 or m)
75th パーセンタイル=upper quartile(Q3)
IQR(interquartile range) = Q3 – Q1

箱の長さ=IQR
箱の中心線=median
箱のくびれ(notch)=medianの95%CIを示す。
箱の幅は√nに比例させることもある。

標準正規分布の場合1.5IQRは ±2.7σ、993%データカバレッジに相当する

ひげの描き方

ひげの描き方には2つの流儀がある。

(1) Tukey style:1.5x IQR内にある最大/最小値を示す
(2) Spear style:最大値/最小値を示す

箱ひげ図を使用する際の推奨事項

箱ひげ図の使用にあたっては以下の実践が推奨される。

(1) サンプル数を明記する
(2) IQR内部に完全に収まらない限りノッチは使用しない
(3) n<5のデータには使わない。(各データを直接プロットする)

Rの箱ひげ図

Rの箱ひげ図ではquartileの代わりにhingeが使用されている。lower /upper hindgeとはデータの下半分/上半分のmedianである。

 関連

オンラインで箱ひげ図を作成できるツール

BoxPlotR: a web-tool for generation of box plots

 

コメント