多重回帰モデルの問題について
今日は脳内整理も兼ねて、多重回帰モデルの問題について、我ここに綴る。
問題は
1,多重共線性
2,決定係数の欠点
3,複数個の係数を同時に鑑定する方法
などである。
今回は、
1,多重共線性について
多重回帰モデルにおいても、単回帰と同じく、最小2乗推定で推定係数や定数項を求める。推定係数に対数最小化条件は
1,eのゼロ・サム条件
2,e と x の直行条件 がある。
推定係数の評価は
単回帰では推定係数がβだけであるが、重回帰においては、β1やβ2へと増える。
そこで、多重回帰モデル特有の問題の1つ→多重共線性
決定係数 R^2 が1に近いにもかかわらず、推定値β1やβ2がある有意水準に設定すると、帰無仮説を棄却できない問題。
有意水準>β1、β2
である。つまり、矛盾が生じている。
これが生じる原因は
推定係数b1の標準誤差σb1を求める時、分母に含まれる相関係数r12が大きい場合、σが大きなる
⇓
すると、t値=b1-0/σb1 より、t値が大きくなる。
⇓
t値が大きくなると、P値が大きくなる。
⇓
すると、母係数β≠0であっても、帰無仮説β=0を棄却できなくなるのである。
そのときの、相関係数r12は分散拡大要因=Variance Inflation Factor と呼ばれる。
VIF=1/1-r^2>10 のときは、多重共線性の疑いがある。
また、推定係数は理論的にプラスが期待されるものの、マイナスの値になることもある。→推定値の符号と理論が合わない。
次回は、決定係数R^2の欠点