平均と分散は独立
導入
標本平均と標本分散が独立であるから、t分布による母平均の検定ができる。
統計の教科書を見ると、大抵helmert行列を使った証明が載っているはず。
ところで適当な標本について標本平均はなんかいい感じの射影行列で表せる。
従ってなら、計画行列による回帰モデルと見ることができる。
ということは、重回帰の回帰係数と残差分散も独立になることは、同様に証明できそう。でも、ちょっと面倒臭そう。そんな話。
借りる性質
結論を言うと、以下の一次変換と二次形式に関する性質(定理?)を使えばよい。
とし、r×nの行列Bとn×nの対称行列Aがあるとする。
このとき、が成立する
さて、これを使えば簡単な計算により、冒頭の「回帰係数と残差分散が独立」は示せる。
が、それ自体には興味がない。
ここでは、この性質がどう示されるかを確かめることにする。
性質が正しいことを確かめる。
証明は、蓑谷『線形回帰分析』から。元々行間は少なく読みやすいが、これの行間をさらに埋める形で。
準備
まず、Aは対称なので直交行列で対角化でき、と分解できる。
と変換すると、Pが直交行列であることと多変量正規分布の変換の性質からとなる。
ここで、とおく。 さらに、Dの対角要素を非ゼロ固有値のと0に分けて、以下のようにブロック行列として書き直す。
ここから証明
であるから、これに右からを掛けても0、つまりである。
ここでが直交行列であることとが対角化できることから、以下となる。
さらに、をブロック行列で見なおす。の階数(=dとおく)に合わせてもブロック行列に書き直すと以下になる*1。
0ってことは、かつになっている。
つまりCの先頭d列は0であり、と表せる。 ここで、
よく見ると、はyのd+1以降の要素のみからなり、他方はyの先頭d個の要素からなる。 従ってyは要素ごとに独立かつ、用いている要素もそれぞれで異なる。従って独立になる
*1:ここはもう少し条件をつけるのが正確だと思う。今回の文脈なら、列フルランクの計画行列Xと、そこから作った射影行列を使うので、CとDの分解のところでDのランクがCの行数を超えることはなく、安心して変形できる。