記述統計(1変数)数値要約 定義 数値要約とはデータを少数の数値に要約する要約統計の手法である。(要約統計の2本柱は数値要約と視覚化である。) 数値要約を構成するキー概念は、代表値と散布度である。 2016.05.28記述統計(1変数)
記述統計(1変数)生データ(raw data) 定義 生データ(raw data)とは、集計や視覚化などの要約処理を行う以前の収集されたデータそのもののことである。これに対して要約統計を行う。 2016.05.28記述統計(1変数)
マルチレベル分析混合軌跡モデリングに必要なサンプル数 混合軌跡モデリングで頑健な推定をするためには、N=300~500以上の標本サイズが推奨される(Nagin,2005) N=100程度のサンプル数があれば分析そのものは可能(高橋, 2015) 標本サイズが小さい場合、検出力が小さ... 2016.05.26マルチレベル分析
マルチレベル分析混合軌跡モデリング 定義 混合軌跡モデリングは、(多母集団の存在が想定される)縦断データ解析に用いられる統計モデルである。 数理的には、グループのレベルではパラメトリック分析を、個人のレベルではノンパラメトリック分析を行うセミパラメトリックな統計モデル... 2016.05.26マルチレベル分析
マルチレベル分析多母集団の成長曲線モデル(=潜在混合モデリング) 同義語 多母集団の成長曲線モデル、潜在混合モデリング、growth mixture 成長曲線モデルの同義語については成長曲線モデルの項を参照して下さい。 定義 成長曲線モデルでは全個体が1つの集団に属することを想定している。 ... 2016.05.26マルチレベル分析
マルチレベル分析成長曲線モデルにおいて2次項を検出するために十分な標本サイズ (Diallo et al, 2014)によるシミュレーション研究から以下の数字を挙げている。 ・4時点データの場合、少なくとも250、理想的には400 ・6時点データの場合、少なくとも100、理想的には150 ・10時点... 2016.05.26マルチレベル分析
マルチレベル分析潜在変化モデル (latent change model) 同義語 潜在変化モデル (latent change model), 潜在差得点モデル(latent change score model) 定義 潜在変化モデル(latent change model)は、2時点の縦断データから、切... 2016.05.26マルチレベル分析
因子分析確認的因子分析を回帰分析の用語で表現する 確認的因子分析(モデルのあてはめ)を回帰分析の用語で表現すると、確認的因子分析では6つのパラメータを推定しているといえる。 (1) 回帰係数(=因子負荷量) (2) (回帰)切片 (3) (回帰)残差分散 (4) 因... 2016.05.25因子分析
因子分析部分的測定不変性 (partial measurement invariance) 概念 部分的測定不変性 (partial measurement invariance)とは、尺度のうちに測定不変性を満たす項目と満たさない項目が混在している状態である。 関連 測定不変性(measurement invariance... 2016.05.25因子分析
因子分析測定不変性(measurement invariance)、測定等価性(measurement equivalence) 同義語 測定不変性(measurement invariance)、測定等価性(measurement equivalence) 定義 測定不変性(measurement invariance)とは尺度(scale)の性質を表す言葉で... 2016.05.25因子分析
因子分析多群確認的因子分析(multiple-group confirmatory factor analysis ; MG-CFA) 定義 研究によっては、異なる群間や、同じ郡の別の時点の潜在因子を比較する必要がある。典型的にはこの比較は潜在因子の平均値の比較によって行われる。 ここで注意しなければならないのは、平均の比較はどんなものであれ全て、測度が異なる群間で... 2016.05.25因子分析
記述統計(1変数)要約統計 (summary statistic) 同義語 要約統計(summary statistic)、記述統計(descriptive statistic) 定義 記述統計(要約統計)とは、生データの情報を圧縮し、データの本質を理解しやすい要約情報を生成し表現する手法の総称である... 2016.05.24記述統計(1変数)
共分散構造分析共分散構造分析において潜在変数(因子)を使うメリット 共分散構造分析において潜在変数(因子)を使うメリットは主に3点ある。 単なる項目の合計点の代わりに因子を使用することによって、相関の希薄化を免れることができる 因子を使用することによりモデルの自由度が上がり、飽和モデルを回避... 2016.05.23共分散構造分析
モデル選択飽和モデル(saturated model) 定義 飽和モデル(saturated model)とは、全ての主効果に加え、考えられる全ての交互作用を含むモデルのことである。考えられる全ての交互作用の次数に制限はない(2次、3次・・・)。 飽和モデルは自由度0のモデルと言うことも... 2016.05.23モデル選択
記述統計(1変数)要約統計量 (descriptive statistic) 同義語 記述統計量(descriptive statistics value) descriptive statistic, descriptive measure 基本統計量 定義 要約統計量とは生データを要約するための「関数... 2016.05.18記述統計(1変数)
記述統計(1変数)Stevensの4つの尺度水準(尺度の分類) Stevens(1946)は尺度(scale)を4つの水準(level)に分類した。尺度をそれが含む情報量によって4種類に分類したものである。 低水準尺度から高水準尺度の順に以下4つである。 Nominal scale(名義... 2016.05.18記述統計(1変数)
記述統計(1変数)代表値(representative value) 定義 代表値(representative value)とは、1組のデータ(あるいは分布)を代表する1つの数値のことである。データを代表するとは、データの分布の中心的位置を示すことを意味する。 実際に何をもって代表値とするのかに関し... 2016.05.18記述統計(1変数)
仮説検定多重検定の補正(multiple-testing corrections) 定義 多重検定の補正(multiple-testing corrections)とは多重検定に伴う偽陽性の問題を解决する(あるいは緩和する)ための方法である。 多重検定法の補正法の分類 FWER制御法(family wise erro... 2016.05.17仮説検定
因子分析3相データに対する因子分析で生じる5つのモデル 3相データに対する因子分析では5つのモデルが生じる。 配置不変モデル(configral invariance) 弱測定不変モデル(weak measurement invariance) 強測定不変モデル(strong measure... 2016.05.17因子分析
共分散構造分析平均共分散構造分析 分散分析における「平均構造」は重回帰分析における「切片」に対応する。 母集団の平均ベクトルを潜在変数の平均で構造化することから命名。 平均構造を解釈する場合は、非標準化推定値を参照する。 具体的な使用例 (1) 縦断データの因子分析 (2)... 2016.05.17共分散構造分析
標本分布母集団と標本の統計量の命名規則 母集団の統計量を母数と呼ぶ。母数は、母○○と命名する。母平均、母標準偏差、母効果量など。 標本の統計量は標本○○と命名する。標本平均、標本標準偏差、標本効果量など。 2016.05.17標本分布
分散分析分散の等質性の仮定 分散分析では条件間で従属変数の分散が等しいことを前提の1つとしている。 実際にそうであるかどうかを確認する方法にbartlett検定がある。 しかしこの仮定が満たされていなくても分析結果には大きく影響しないことが知られている。 2016.05.17分散分析
仮説検定αエラー(第1種の誤り:Type Ⅰ error) 同義語 第1種の誤り (Type Ⅰ error)、αエラー、アルファエラー 定義 第1種の誤り(αエラー)とは、実際には帰無仮説が正しい場合に、誤って帰無仮説を棄却してしまう誤りのことである。 伝統的にはα=0.05を使用する... 2016.05.14仮説検定
記述統計(2変数)γ係数 (GoodmanとKruskalの順序連関係数) γ係数は -1から1の値を取る。0が連関無し、1が完全な正の連関、2が完全な負の連関を意味する。 関連 連関(association)と相関(correlation) 2016.05.10記述統計(2変数)
マルチレベル分析自己共分散(auto-covariance) 定義 自己共分散とは、時系列データ(縦断データ)において、ある時点の観測変数Xとその1時点前の観測変数Xとの共分散のことである。 2016.05.09マルチレベル分析
記述統計(1変数)中心化(センタリング) 同義語 中心化、センタリング、centering 定義 中心化(centering)とは、ある変数の得点から定数を引くことである。 引く定数として何を使用するのかは、研究の文脈によって様々である。通常は、その変数の平均値を使用し... 2016.05.09記述統計(1変数)
モデル選択尤度比検定(likelihood ratio test) 定義 尤度比検定とは、ネスト関係にある2つのモデルの逸脱度(deviance)に有意差があるかどうかを検証する検定である。ネストの関係にないモデルの比較をすることはできない。 帰無仮説(H0) : 2つのモデルの逸脱度には有意差はな... 2016.05.09モデル選択
因子分析n因子モデルとn次因子モデル 定義 n因子モデル(1因子モデル、2因子モデル、・・・)は因子数n個を想定した因子分析モデルのことである。 n次因子モデルは、因子にn次の階層構造を想定した因子分析モデルのことである。例えば(下位の)因子1、因子2、因子3が(上位の)因... 2016.05.09因子分析
生存時間分析生存曲線の交差(crossing hazards) 同義語 生存曲線の交差、crossing hazards 定義 crossing hazardsとは、キャプランマイヤー曲線において、群間の生存曲線が交差する現象のことである。 crossing hazardsは、(1)統計解析、(... 2016.05.07生存時間分析
仮説検定多重検定の問題(検定の多重性の問題) 定義 多重検定の問題(検定の多重性の問題)とは、1回ならαエラーを犯す確率の低い検定であっても、複数回繰り返すと偽陽性の推測(false positive inference)の回数も増えてしまう問題のことである。(なお1回の検定でαエラ... 2016.05.07仮説検定
データマイニング辞典交差妥当化 (cross validation) 定義 交差妥当化(cross validation)とは、統計モデルが、そのモデルを構築する際に使用したデータ=学習データ)とは別のデータセットに対してどの程度、一般化可能であるかを評価する手法である。要するに統計モデルの評価法の外的妥当... 2016.05.04データマイニング辞典
標本抽出法層化多段抽出法(stratified multistage sampling) 定義 層化多段抽出法 (stratified multistage sampling)とは層化抽出法 (stratified sampling)と多段抽出法 (multistage sampling)を併用する抽出法である。具体的には、ま... 2016.05.04標本抽出法
標本抽出法層化抽出法 (stratified sampling) 定義 層化抽出法 (stratified sampling)とは大規模な母集団(=全調査対象)に対して、以下の方法で行う標本抽出の手続きのことである。 (1) 母集団をいくつかのグループ(=層、stratum)に分割する。 (2) 全... 2016.05.04標本抽出法
標本抽出法多段抽出法 (multistage sampling) 定義 多段抽出法(multistage sampling)とは大規模な全調査対象に対して、以下の方法で行う標本抽出の手続きのことである。 (1) 母集団をいくつかの集落(cluster)に分割する。 (2) 分割された集落から、いくつ... 2016.05.04標本抽出法
標本抽出法集落抽出法 (cluster sampling) 定義 集落抽出法(cluster sampling)とは大規模な全調査対象に対して、以下の方法で行う標本抽出の手続きのことである。 (1) 母集団をいくつかの集落(cluster)に分割する。 (2) 分割された集落から、いくつかの集... 2016.05.04標本抽出法
確率論周辺確率 (marginal probability) 定義 周辺確率(marginal probability)とは、ある同時確率に対して、それを構成する1つの分割に関して全てを合算した確率である。 $$ \sum\limits_{i = 1}^a {p({A_i},{B_j}) ... 2016.05.01確率論
確率論同時確率 (joint probability) 定義 同時確率(joint probability)とは、ある分割A(A1,A2,...Aa)と別の分割B(B1,B2,...Bb)がある時に、事象Aiと事象Biが同時に観察される確率である。 同時確率はp(Ai, Bj)と表記する... 2016.05.01確率論
確率論古典的確率 定義 古典的確率では、事象Aの確率 p(A) は以下のように定義される。 p(A) = 事象Aに含まれる根源事象の数 / 標本空間に含まれる根源事象の数 即ち古典的確率とは、ある事象に含まれる根源事象の数の、標本空間に含まれる... 2016.05.01確率論
一般線形モデル多変量解析 (multivariate analysis) 同義語 多変量解析(multivariate analysis)、多変量統計(multivariate statistics) 定義 多変量解析は多変量データ(=複数の変数で構成されるデータ)を統計的に処理し、そこから何らかの有益な情... 2016.05.01一般線形モデル
連関規則連関規則 (association rule) 同義語 連関規則、連想規則、アソシエーションルール 定義 連関規則とは、属性Aを持つオブザベーションが属性Bも持つ確率が高い、という知識のことである。上記の連関規則は、A → B、と表記する。 例えばAmazonでは「この商品を買っ... 2016.05.01連関規則
共分散構造分析成長曲線モデル (Growth Curve Model, GCM) 同義語 成長曲線モデル(growth curve model)、潜在曲線モデル(latent curve model)、潜在成長モデル(latent growth model)、マルチレベルモデリング、マルチレベル分析、階層線形モデル(h... 2016.04.27共分散構造分析
共分散構造分析共分散構造分析における変数の分類 共分散構造分析の観点からは変数を3つの観点で分類可能である。 (1) 観測変数 vs 潜在変数 観測変数:直接観測される変数(因子分析なら項目) 潜在変数:直接測定できない変数(因子分析の因子など) (2) 構造変数 vs 誤差変数 構... 2016.04.27共分散構造分析
モデル選択適合度指標 (fit index) 定義 適合度指標とはモデルとデータの当てはまり具合を数値で表す指標である。 適合度指標はモデルの全体的評価に用いられる。 適合度指標は「絶対的指標」と「相対的指標」に分類される。 絶対的指標とは、その数値に絶対的な基準値... 2016.04.21モデル選択
共分散構造分析共分散構造分析の適合度指標 共分散構造分析で用いられる代表的な適合度指標を以下にまとめる。 指標 解釈 CFI (comparative fit index) 比較的適合度指標 1に近いほど適合良好 0~1の値を取る TLI (Tucker-Le... 2016.04.21共分散構造分析
重回帰分析擬似相関 (spurious correlation) 定義 擬似相関(spurious correlation)とは、実質科学的な意味での関係性がないにも関わらず、変数間に現れる見かけ上の相関のことである。 変数xと変数yに擬似相関が生じる原因となるのは、変数x、y双方と相関を持つ変数... 2016.04.21重回帰分析
共分散構造分析MIM、MIMIC、PLSモデル 多重指標モデル(multiple indicator model) 多重指標モデルは構成概念間の回帰分析モデルである。 上記例では、構成概念f2が構成概念f1によって説明されることを仮定している。 MIMICモデル (Multip... 2016.04.21共分散構造分析
因子分析因子分析(factor analysis) 定義 因子分析とは、観測変数の背後に少数の潜在的な共通因子(common factor)の存在を仮定し、この共通因子から観測変数への影響を推定することを通して、観測変数から生成される相関行列を説明しようとする統計モデルである。 因子... 2016.04.18因子分析
因子分析解の回転(rotation) 解の回転とは:因子負荷量の絶対値が、値の大きなものと小さなもの(0に近いもの)に、分離されるように初期解を変換すること。 解の回転方法は、「直交回転(orthogonal rotation)」と「斜交回転(oblique rotation... 2016.04.18因子分析