導入
標本平均と標本分散が独立であるから、t分布による母平均の検定ができる。
統計の教科書を見ると、大抵helmert行列を使った証明が載っているはず。
ところで適当な標本について標本平均
はなんかいい感じの射影行列で表せる。
従ってなら、計画行列
による回帰モデル
と見ることができる。
ということは、重回帰の回帰係数と残差分散も独立になることは、同様に証明できそう。でも、ちょっと面倒臭そう。そんな話。
借りる性質
結論を言うと、以下の一次変換と二次形式に関する性質(定理?)を使えばよい。
とし、r×nの行列Bとn×nの対称行列Aがあるとする。
このとき、
が成立する
さて、これを使えば簡単な計算により、冒頭の「回帰係数と残差分散が独立」は示せる。
が、それ自体には興味がない。
ここでは、この性質がどう示されるかを確かめることにする。
性質が正しいことを確かめる。
証明は、蓑谷『線形回帰分析』から。元々行間は少なく読みやすいが、これの行間をさらに埋める形で。
準備
まず、Aは対称なので直交行列で対角化でき、
と分解できる。
と変換すると、Pが直交行列であることと多変量正規分布の変換の性質から
となる。
ここで、とおく。
さらに、Dの対角要素を非ゼロ固有値の
と0に分けて、以下のようにブロック行列として書き直す。
ここから証明
であるから、これに右から
を掛けても0、つまり
である。
ここでが直交行列であることと
が対角化できることから、以下となる。
さらに、をブロック行列で見なおす。
の階数(=dとおく)に合わせて
もブロック行列に書き直すと以下になる*1。
0ってことは、かつ
になっている。
つまりCの先頭d列は0であり、と表せる。
ここで、
よく見ると、はyのd+1以降の要素のみからなり、他方
はyの先頭d個の要素からなる。
従ってyは要素ごとに独立かつ、用いている要素もそれぞれで異なる。従って独立になる
*1:ここはもう少し条件をつけるのが正確だと思う。今回の文脈なら、列フルランクの計画行列Xと、そこから作った射影行列を使うので、CとDの分解のところでDのランクがCの行数を超えることはなく、安心して変形できる。