決定木の分岐基準

定義

決定木の計算過程では、逐次的に分岐を繰り返しながら決定木を成長させていくことになる。

この過程では、どのように決定木を成長させるか、即ち多数ある分岐の候補の中から、いかにして最適な分岐を選択するかという判断が必要となる。この判断基準を「分岐基準」と呼ぶ。

一般的によく使用される分岐基準

分類木における分岐基準は、不純度(impurity)の差を最大化することである。不純度としてはジニ係数(Gini index)や情報利得(information gain)などが使用される。

回帰木における分岐基準は、級間平方和(=層間平方和=ノード間平方和)を最大化することである。

 

コメント