クラスター間の距離の定義方法

クラスター分析において、観察対象と観察対象の距離の定義は1つしか無いが、クラスターとクラスターの距離には複数の定義がある。実務的にはウォード法を使用するのが一般的である。

方法定義
最短距離法2つのクラスターに含まれる対象の全組み合わせの距離を求め、最も近い距離=クラスター間の距離と定義する。
最長距離法2つのクラスターに含まれる対象の全組み合わせの距離を求め、最も遠い距離=クラスター間の距離と定義する。
群平均法2つのクラスターに含まれる対象の全組み合わせの距離を求め、その平均=クラスター間の距離と定義する。
重心法クラスターごとの重心(平均)を求め、重心と重心の距離=クラスター間の距離と定義する。
ウォード法2つのクラスターを併合した時の平方和(散布度)の増加量=クラスター間の距離と定義する。
2つのクラスターを併合した時の平方和(散布度)の増加量=(AとBを併合した後の平方和)-(A内の平方和)-(B内の平方和)

関連

鎖効果

コメント