要約統計 (summary statistic)

同義語

要約統計(summary statistic)、記述統計(descriptive statistic)

定義

記述統計(要約統計)とは、生データの情報を圧縮し、データの本質を理解しやすい要約情報を生成し表現する手法の総称である。

生データそのものが情報量としては最大であるが、人間の脳にとって膨大すぎる情報量ではかえって本質が捉えにくい(役に立たない)。生データの持つ本質的な情報を保持しながら、情報の一部を捨てあえて去ることで、人間の脳にとっての情報の有益性は増加する。情報はうまく捨てることで価値が増すということである。

要約統計の分類

要約統計は結果の表現方法から、数値要約と視覚化に分類出来る。数値要約とはデータを少数の数値に要約するものである。視覚化はデータを図やグラフなどで表現することである。

要約統計は扱う変数の数によって、1変数の要約統計と2変数の要約統計に分類することもできる。

関連

要約統計量

数値要約において要約結果(である数値)を計算する方法(=関数)を「要約統計量」と呼ぶ。要約統計量そのものは厳密には関数である。関数値の方を示す明確な用語はないが、あえて言えば「要約統計量の数値」である。
数値要約ではどのようにして要約統計量を定義、計算するかということが理論の中心的話題となる。

コメント