定義
箱ひげ図(box plots)はデータの分布を視覚的に表現する図の1種である。
箱ひげ図では以下の数値が表現される。
25th パーセンタイル=lower quartile (Q1)
50th パーセンタイル=median (Q2 or m)
75th パーセンタイル=upper quartile(Q3)
IQR(interquartile range) = Q3 – Q1
箱の長さ=IQR
箱の中心線=median
箱のくびれ(notch)=medianの95%CIを示す。
箱の幅は√nに比例させることもある。
標準正規分布の場合1.5IQRは ±2.7σ、993%データカバレッジに相当する
ひげの描き方
ひげの描き方には2つの流儀がある。
(1) Tukey style:1.5x IQR内にある最大/最小値を示す
(2) Spear style:最大値/最小値を示す
箱ひげ図を使用する際の推奨事項
箱ひげ図の使用にあたっては以下の実践が推奨される。
(1) サンプル数を明記する
(2) IQR内部に完全に収まらない限りノッチは使用しない
(3) n<5のデータには使わない。(各データを直接プロットする)
Rの箱ひげ図
Rの箱ひげ図ではquartileの代わりにhingeが使用されている。lower /upper hindgeとはデータの下半分/上半分のmedianである。
関連
オンラインで箱ひげ図を作成できるツール
BoxPlotR: a web-tool for generation of box plots


コメント