データマイニング辞典

ベイジアンネットワーク

ベイジアンネットワーク(Bayesian network : BN)

同義語 ベイジアンネットワーク(Bayesian network : BN)、信念ネットワーク(belief network) 定義 ベイジアンネットワーク(Bayesian network : BN)は、多変数間の確率的依存関係を視...
クラスター分析

鎖効果

定義 鎖効果とは、クラスター分析において、ある1つのクラスターに対象が1つずつ順番に吸収されながらクラスターが形成される現象のこと。最短距離法で起こりやすい。望ましくない現象であるため、鎖効果の起きにくいウォード法が使用されることが多い。
クラスター分析

クラスター間の距離の定義方法

クラスター分析において、観察対象と観察対象の距離の定義は1つしか無いが、クラスターとクラスターの距離には複数の定義がある。実務的にはウォード法を使用するのが一般的である。 方法 定義 最短距離法 2つのクラスター...
クラスター分析

クラスター分析(cluster analysis)

定義 観測対象を、いくつかの似た者同士のグループ(=クラスター)に分類するデータマイニングのデータマイニングの1手法である。 クラスター分析の分類 クラスター分析は「階層的手法」と「非階層的手法」に分類される。 階層的クラスター...
決定木分析

プルーニング(pruning)

同義語 プルーニング、枝刈り、剪定、pruning 定義 プルーニングとは複雑なモデルをあえて単純化させることにより、実運用上、よりあてはまりのよいモデルを構築する手続きのことである。 解説 一般に統計モデルのあてはまり(fitt...
決定木分析

決定木の分岐基準

定義 決定木の計算過程では、逐次的に分岐を繰り返しながら決定木を成長させていくことになる。 この過程では、どのように決定木を成長させるか、即ち多数ある分岐の候補の中から、いかにして最適な分岐を選択するかという判断が必要となる。この判...
決定木分析

決定木(decision tree)

定義 決定木(decision tree)とは、オブザベーションの分類(classification)を目的とした機械学習の結果として出力される図である。 機械学習によってデータを最も良く説明する分類を生成するのだが、この分類がツリ...
決定木分析

エキスパートシステム(expert system)

同義語 エキスパートシステム、expert system 定義 エキスパート・システムは、人工知能の実装の1つである。具体的にはプロダクション・システムと呼ばれる論理命題の集合(要するに既知の知識の集合体)を事前に登録しておき、それに...
データマイニング辞典

交差妥当化 (cross validation)

定義 交差妥当化(cross validation)とは、統計モデルが、そのモデルを構築する際に使用したデータ=学習データ)とは別のデータセットに対してどの程度、一般化可能であるかを評価する手法である。要するに統計モデルの評価法の外的妥当...
連関規則

連関規則 (association rule)

同義語 連関規則、連想規則、アソシエーションルール 定義 連関規則とは、属性Aを持つオブザベーションが属性Bも持つ確率が高い、という知識のことである。上記の連関規則は、A → B、と表記する。 例えばAmazonでは「この商品を買っ...
決定木分析

ジニ係数

同義語 ジニ係数(Gini coefficient) 定義 ジニ係数は、ある集団内における所得分配の不平等の程度を表す指標である。 ジニ係数は0~1の値を取る。全員が同じ所得の場合、ジニ係数は0となる。所得分配が不平等になればな...
スポンサーリンク