サンプルの分散(sample variance)とサンプリングの分散(sampling variance)

同義語

日本語訳としていずれも定まっていないが、sampleとsamplingを明確に区別することが必須である。そのためここではsampleを”サンプルの”、samplingを”サンプリングの”と直訳した。

定義

Sample varianceとは

Sample varianceとはある1つの標本における観察データの分散である。

Sample varianceには2つの種類がある。

標本に基づいて推定された母集団の分散。いわゆる不偏分散であり通常はこちらを使用することが多い。分母は(自由度)は n-1。(但しnはサンプル数)。

当該標本の分散。この場合分母はn。

Sampling varianceとは

Sampling varianceとは、もしある研究と同じ研究を何度も繰り返したら得られるであろう、ある統計量(例えば平均)の分散である。研究を繰り返すということは標本抽出/データ収集/統計量の計算、を繰り返すことを意味する。このように研究を繰り返し実行して得られた統計量の分布のことを標本分布(sampling distribution)と呼ぶ。

しかし実際には中心極限定理(central limit theorem)というものがあるので、いくつかの統計量は実際に研究を繰り返す必要はなく、1つの標本からsampling varianceを推定可能である(但しその1つの標本は母集団を代表するもの,representativeなものである必要がある)。これを漸近アプローチ(asymptotic approach)と呼ぶ。
あるいは1つの標本を使用しながら、あたかも実際に研究を繰り返したかのようにシミュレーションすることもできるこれがブートストラップ法 bootstrapping approachである。

要するに1回だけの研究データからsampling varianceを数学的に導出するのが漸近アプローチであり、同じデータからシミュレーションによってsampling varianceを導出するのがブートストラップ法でえる。

 

参考

本記事は以下の記事に基づき一部を修正したものである。

Attention Required! | Cloudflare

 

コメント