統計学辞典

因子分析

単純構造(simple structure)

単純構造とは:探索的因子分析の結果として推定された因子負荷行列において、各観測変数が可能な限り少数の因子(従って理想的には1つの因子のみ)からのみ大きな影響を受けている状態のこと。 単純構造は2つ以上の因子の存在が仮定される場合に、因子負...
因子分析

スクリープロット(scree plot)

相関行列から計算される固有値をy軸、固有値の連番をx軸に、固有値の大きいものから小さいものへと順にプロットした図のこと。 探索的因子分析における因子数決定の判断材料の1つとして使用される。 具体的には、スクリープロットを左から見て行き、...
標本分布

中心t分布と非心t分布

中心t分布とは、母集団においてμ1-μ2=0の場合(=即ち帰無仮説が真である時の)のt検定量の分布である。単にt分布という時には、中心t分布を意味する。 非心t分布とは、母集団においてμ1-μ2≠0の場合(=即ち帰無仮説が真である時の)の...
標本分布

中心極限定理 (central limit theorem : CLT)

定義 中心極限定理 (central limit theorem : CLT)とは、母集団の分布の形のいかんによらず、標本数が大きくなるにつれ、標本平均の分布は正規分布に近づくという法則のことである。 中心極限定理によれば、母集団分...
一般線形モデル

剰余変数

同義語 干渉変数、交絡変数、2次的変数、第3の変数、外生変数、調整変数 共変数、共変量(分散分析の文脈ではこう呼ばれることが一般的である) 定義 剰余変数とは、研究の焦点(主たる関心事)ではないが、目的変数に影響を与えうる変数の...
仮説検定

検定統計量F

定義 検定統計量F = モデルの平均平方 / 残差の平均平方 性質 検定統計量Fは相関係数の検定のt検定量の2乗に一致する。 検定統計量Fの分母の自由度=相関係数の検定のt検定量の自由度
モデル選択

AIC(Akaike information criteria)

定義 AICは以下の式で計算される。 $$AIC=-2\log { L } +2k$$ L: 尤度、k:(推定される自由)パラメータの数。パラメータの数とはモデルに含まれる説明変数の数のことである。 モデル選択(mo...
重回帰分析

重回帰分析における統計的推測の前提条件(仮定)

重回帰分析における統計的推測の前提条件は、説明変数で目的変数を予測した時の残差が正規分布(平均0、分散一定)に従うというものである。 なお、説明変数や目的変数には正規分布は仮定されていない。 関連 一般線形モデルの仮定
重回帰分析

抑制変数

定義 重回帰分析においては、目的変数と直接には無相関な変数を説明変数に加える事でモデル全体の分散説明率を高められることがある。 このような目的変数と直接には無相関であるにも関わらず、説明変数としてモデルの分散説明率を高める変数を抑制変数...
重回帰分析

標準偏回帰係数

標準回帰係数は、目的変数と説明変数を全てz得点に変換した上で求めた偏回帰係数である。 偏回帰係数をb1, b2 , ...、対応する標準偏回帰係数をb1*, b2*, ...と表記することにする。 線形予測子として、y = b0 + b...
分散分析

共分散分析 (analysis of covariance : ANCOVA)

定義 共分散分析モデルは、説明変数に量的変数と質的変数の両方を含む一般線形モデルである。 実際の共分散分析では、質的変数に主たる関心があり、量的変数は統制されるべき変数(=剰余変数)とみなされることが多い。即ち、各群の...
分散分析

バランスデザインとアンバランスデザイン

分散分析の文脈では、対象となるデータの構造から、実験デザインは、バランスデザインとアンバランスデザインに分類される。 バランスデザインとは、各水準のサンプル数が等しい実験デザインのことである。 アンバランスデザインとは、各水準の...
標本分布

ブートストラップ法

リサンプリングとコンピュータによる大量の反復計算による、推定量の標本分布を導出する手法。複雑な数理を必要とせず、一般的な方法であらゆる標本分布を導出可能な点で優れている。 関連 精密標本分布論 漸近展開
標本分布

漸近展開

精密な標本分布を数理的に導出できない統計量に対して近似的な標本分布を導出する手法。 エッジワース展開、コーニッシュ=フィッシャー展開などが代表的な手法である。 歴史的には精密標本分布論に続けて発達した。 関連 精密標本分布論
標本分布

精密標本分布論

精密標本分布論とは:小~中サイズの標本に対する精密な標本分布を求める学問分野。 大きな標本の場合、多くの統計量(平均、分散、比率etc)の標本分布は正規分布で近似できるが、中小標本はその限りではない。そのためこの分野が発達した。 ゴセッ...
分散分析

相関比η (correlation ratio)

同義語 相関比 (correlation ratio)、η(エータと読む) 定義 「分散分析の相関比η」は「重回帰分析の重相関係数R」に相当する概念である。 (相関比)2 = 決定係数R2 相関比ηは分散分析は以下の式で定...
分散分析

要因(factor) と 水準(level)

定義 「要因」は一般統計学でいう「質的説明変数」のことである。「水準」は要因内で取りうる実際の値のことである。 分散分析では一般統計学と同一の概念が独特の名称で呼ばれることが多い。「要因」と「水準」も分散分析の独特の用語である。 要因...
共分散構造分析

同値モデル

定義 同値モデルとは:同じデータに対して、適合度が必ず同じになる複数のモデルのこと。
共分散構造分析

モデルの識別性

定義 モデルの識別性とは、共分散構造分析において、モデルの未知母数の推定値が1つに定まるかどうか、という意味である。 共分散構造分析において、モデルから導かれる共分散構造と、観測されたデータの共分散の値を等しいと仮定した連立方程式への適...
共分散構造分析

平均構造

定義 平均構造とは、観測変数の平均を母数の関数として表現したものである。 共分散構造分析ではモデルに平均構造を含める場合と含めない場合がある。平均構造を平均構造をモデルに含めた共分散構造分析は「平均・共分散構造分析」と呼ばれる。
共分散構造分析

共分散構造分析

定義 共分散構造分析とは「共分散構造」と実際のデータから計算される共分散の値の差が最小化するように母数の値を推定する統計手法の総称である。 「共分散構造」とは、モデルに含まれる母数を使用して、観測変数間の共分散を理論的に表現したもの...
因子分析

共通性(communality)

共通性とは、観測変数の分散のうち、共通因子で説明できる成分の割合のこと。 共通性の2乗+独自性の2乗=1となるように定められている。
マルチレベル分析

傾きを基準変数とするモデル (slope-as-outcome model)

マルチレベル分析において、ランダム切片・係数モデル分析の結果、上位グループによる差異の存在が明らかになった状況を考える。この分析に続いて、更にランダム切片および各ランダム係数について、上位レベルの説明変数での解析を試みる手法が「傾きを基準変...
マルチレベル分析

マルチレベル分析におけるモデルの分類(最小モデル、ランダム切片モデル、ランダム係数モデル、ランダム切片・係数モデル)

マルチレベル分析におけるモデルは5つに分類できる。 (1) 最小モデル (2) ランダム切片モデル(RIモデル) (3) ランダム係数モデル (RCモデル) (4) ランダム切片・係数モデル (RICモデル) (5) フルモデル ...
マルチレベル分析

最小モデル

定義 最小モデルはマルチレベル分析におけるレベルの1種である。 最小モデルは下位レベル(レベル1)において切片と誤差項からのみなる線形予測子を仮定し、この切片に変量効果を仮定するモデルである。即ち説明変数の項を含まないモデルである。 ...
メタ分析

メタアナリシスのモデル

メタアナリシスやマルチレベル分析には3つの統計モデルがある。 (1) ランダム効果モデル(random effect model) (2) 混合効果モデル(mixed effect model) (3) 固定効果モデル(f...
マルチレベル分析

プールド・データ (pooled data)

階層データは、階層を無視して全部ひとまとめのデータと考えることもできる。 この全部をひとまとめにしたデータを「プールド・データ」と呼ぶ。
分散分析

イプサティブデータ (ipsative data)

イプサティブデータ(ipsative data)とは、同一被験者からの(複数の条件での)反復測定により収集されたデータのうち、どの被験者においても被検者内反復測定データの和が一定値となるタイプのデータのこと。 例えば、好きなものに順位付け...
分散分析

球面性の仮定

球面性の仮定とは「被験者内の水準間の差の分散(=ある要因の水準から任意の2つずつを対にして従属変数の差を取った時に、ブロックや被験者の母集団におけるその差の分散)が、どの水準対でも同じになる」という仮定である。 球面性の仮定は、対応のある...
記述統計(1変数)

標準化(standardization)

定義 標準化(standardization)とは、各データから平均値を引いた上で(即ち中心化した上で)、更にその結果を標準偏差で割ることである。 使用方法 標準化は統計学のあらゆる分野で使用される。 正規分布に従うデータを標準化す...
分散分析

回帰係数の等質性の仮定

回帰係数が等質である=(ある要因とある共変量の間に)交互作用が存在しない ある要因の各水準で、従属変数を共変数で予測する回帰直線を作成する → これらの回帰直線の傾きが全て等しい(=全回帰直線が平行である)かどうかを調べたい → 要因と共...
分散分析

分散分析の事後検定

分散分析ではその結果に基づき事後検定が行われるのが一般的である。 分散分析にて群間に有意差がありとの結果が出た場合 → 主効果の事後検定として「多重検定」に進む。この多重検定には諸々の手法があるが、代表的なものにテューキーの多重検定がある...
分散分析

2次の交互作用

3つの要因がある分散分析を考える。 このうち2つの要因間の(一次の)交互作用のあり方が、第3の要因の水準によって異なる時、「2次の交互作用がある」と言う。
分散分析

交互作用 (interaction)

同義語 交互作用(interaction) 定義 交互作用(がある)とは、多要因分散分析の文脈において、ある要因の特性値に対する効果が、他の要因の水準によって異なることを意味する。 即ち、交互作用があるとは、多要因分散分析におい...
分散分析

「分散分析」と「テューキーの多重検定」の関係

「分散分析」と「テューキーの多重検定」の結果には必ずしも整合性がない。 分散分析で有意差があるのに、テューキーの多重検定ではどの群間にも有意差なしとの結果が出ることがある。 逆に分散分析で有意差がないのに、テューキーの多重検定ではどこか...
分散分析

分散分析表

定義 分散分析表は分散分析の結果を要約した表である。一般に以下のような形式を取る。 変動要因 自由度 (Df) 平方和 (Sum Sq) 平均平方 (Mean Sq) 統計量 F Va...
重回帰分析

自由度調整済み重相関係数

一般に独立変数の数を増やせば増やすほど、母集団の重相関係数は過大評価されやすいことが知られている。これを補正したものが「自由度調整済み重相関係数」である。
重回帰分析

偏相関係数と部分相関係数

定義 (単純)相関変数は2つの量的変数間の関係性を評価する指標である。 これに対し、偏相関係数と部分相関係数は、3つ以上の変数がある場合に、この中から取り出した2変数の相関係数であるが、2変数の単純相関係数ではなく、第3の変数の影響を除...
重回帰分析

多重共線性(multicollinearity)

同義語 マルチコ 定義 多重共線性(multicollinearity)とは、重回帰分析において予測変数間の相関が高すぎる状態のことである。 多重共線性を含む直線回帰モデルでは、その予測値は安定しているが、回帰係数の推定量が不安...
重回帰分析

重回帰分析における各独立変数の有意性の検定

帰無仮説 2通りの表現が可能であるが、数理的な内容は同一である。 (1) 母集団において全ての独立変数を用いて予測した時の重相関係数と、ある変数(例えばx1)を除外してその他の全ての変数を使って予測した時の重相関係数は等しい。 (2)...
重回帰分析

重相関係数の有意性の検定

帰無仮説:母集団の重相関係数はゼロである 検定統計量:F値(分子の自由度df1=p、分母の自由度df2=N-p-1) F = (R2/p) / {(1-R2)/(N-p-1)} ここでpは独立変数の個数、Nはサンプル数(=レコード数)...
重回帰分析

重相関係数R (multiple R-squared)

重相関係数とは、従属変数yとその予測値y_hatとの相関係数である。 Rと表記されるのが一般的である。 関連 自由度調整済み重相関係数(adjusted multiple R-squared) 重相関係数の有意性の検定 R2は「分...
記述統計(2変数)

連関(association)と相関(correlation)

連関(association)とは質的変数間の関連性のことである。 相関(correlation)とは量的変数間の関連性のことである。 統計学では「連関」と「相関」は区別される。
記述統計(1変数)

相加平均=算術平均 (arithmetic mean)

同義語 相加平均、算術平均(arithmetic mean) 定義 算術平均(arithmetic mean)とは、各データをxi(x1,x2,x3....)とする時、 Σ(xi-t)2  を最小化する値tのことである...
一般線形モデル

自由度(degree of freedom)

ある統計量とその算出に必要な数式を考える。 算出に必要な数式は「データに基づく(偏差)平方」と「統計量の算出に必要な統計量(=母数)」からなる。 この際に「自由度」は以下のように定義される。 「自由度」=「データに基づく(...
一般線形モデル

平均平方 (mean square)

同義語 平均平方(mean square) 定義 平均平方とは「1自由度あたりの平方和」の大きさのことである。 平均平方 = 偏差平方和 / 自由度 関連 自由度(degree of freedom)
一般線形モデル

直交分解

以下の平方和の分解の分解を考える。 従属変数の平方和=モデルの平方和+誤差の平方和 この際に「モデルの平方和」と「誤差の平方和」が完全に無相関であるように分解した場合、これを「直交分解」と呼ぶ。 幾何学的に言えば上記の直交分解は、 ...
推定

推定量(estimator)と推定値(estimate)

推定量は確率変数であり、推定値はその実現値である。 推定量は通常、標本分布のx軸に相当するものである。 即ち、関心を持っている(=値を知りたいと思っている)母数を推定するための標本分布における統計量である。
仮説検定

p値(p-value)

同義語 限界水準、有意確率 定義 p値(p-value)とは、帰無分布において実測値と同等かそれ以上に外れた値が出現する確率のことである。 p値は、第1種の誤りの確率でもある。 関連 帰無分布(null distributi...
標本分布

標本誤差

「標本誤差」とは、1つのサンプルから計算された推定値と母数の差のこと。 「標準誤差」とは1文字違いであるが、全然違う概念なので要注意。
スポンサーリンク