決定木(decision tree)

定義

決定木(decision tree)とは、オブザベーションの分類(classification)を目的とした機械学習の結果として出力される図である。

機械学習によってデータを最も良く説明する分類を生成するのだが、この分類がツリー状のMECEな階層構造に構築されたものが決定木である。

決定木の構成要素の名前

ノード(node):人工知能が生成した分類(グループ)である。

ルート(root):ノードのうち、最上位のものである。要するに解析対象のデータ全体である。

ブランチ(branch):決定木のうちの任意の部分木である。(ツリーは再帰的な構造である)

ターミナルノード(terminal node):末端となるノード。

親(ancestor):ノード間に階層関係がある場合に、上位階層(ルート側)に位置するノードのこと。

子(descendant):ノード間に階層関係がある場合に、下位階層(末端側)に位置するノードのこと。

決定木の分類

基準変数が質的変数である決定木を「分類木(classification tree)」と呼ぶ。

基準変数が連続変数である決定木を「回帰木(regression tree)」と呼ぶ。

伝統的な統計学との対比すれば、分類木は判別分析、回帰分析は重回帰分析に対応する。

コメント