変数変換 | Dr.Clover’s Computer Clinic

定義

統計学における変数変換は、モデルフィッティングによって得らえるパラメータの推定値が、実際のデータの意味に照らして意味のある範囲内に収まるように制約をかけるために行う、変数の変換処理のことである。

従属変数が負の数を取りえない場合（例えば死亡率）に、従属変数の対数に対して線形予測子をあてはめる方法である。具体的には以下のようになる。

ln(Y) = β0 + β1×1 + ….

対数変換は、対数関数の引数は必ず正の数であり、負の数を取り得ないことを利用したものである。

リスク（割合）の範囲は[0,1]である。一方、回帰直線の傾きは[+∞,-∞]の範囲を取る。

両者の取りうる範囲の不整合を解決するために、ロジスティック変換を使用することが出来る。

ln[R/(1-R)] = a0 + a1X

回帰直線の傾きa1の範囲[+∞,-∞]でありながら、リスクRの範囲[0,1]が達成される

変数変換した場合、パラメータの解釈は複雑になるというデメリットがある。

変数変換して得られるパラメータは、研究目的に照らして本来知りたいものに対応しているかという視点も重要である。

変数変換によりパラメータの値の範囲には制約をかけられるが、実データから得られる回帰線の形状と、統計モデルが前提とする回帰線の形状が一致するのかいう別の問題もある。この問題の解決には、因子化やスプライン回帰分析などの手法が有用である。