リーマンの勉強記録

資格試験の記録用にはじめました。

統計検定2級(3)

今日は(母平均の検定を意識して)検定統計量の勉強をしました。内容を整理しておきたいと思います。

まず、ある確率分布に従う確率変数Xの標本平均を\overline{X}と書くと、それを標準化した確率変数Zは

 Z = \frac { \overline{X} - E(\overline{X}) }{\sqrt{V(X)}}

です。標本平均の平均は母平均 \mu、標本平均の分散は母分散 \sigma\ ^2をサンプルサイズnで割ったものとなるので*1

 Z =  \frac { \overline{X} - \mu\ }{\sqrt{ \frac{ \sigma\ ^2}{n} }}

です。「ある確率分布」が正規分布であるならZは標準正規分布に従うので、母分散が既知であれば「母平均 \muがいくらである」といった帰無仮説を立ててZ検定すれば母平均の検定ができます。

母分散が既知というケースは稀です。母分散 \sigma\ ^2が未知の場合は、代わりに標本から計算した不偏分散 s ^2を使い、

  \frac { \overline{X} - \mu\ }{\sqrt{ \frac{ s ^2}{n}}}

を検定統計量とします。ただし、もはやこの統計量がどのような分布に従うかはわからないので*2、上の統計量を変形して

  \frac {\frac { \overline{X} - \mu\ }{\sqrt{ \frac{  \sigma\ ^2}{n}}}}{ \sqrt{\frac{ s ^2}{\sigma\ ^2}}} =
\frac{ \frac{ \overline{X} - \mu\ }{ \sqrt{ \frac{  \sigma\ ^2}{n}}}}{ \sqrt{\frac{ (n-1) s ^2}{\sigma\ ^2} / (n-1) }}

を得ます。分子はZ統計量なのでXが正規分布に従うならこれは標準正規分布に従います。分母の \frac{ (n-1) s ^2}{\sigma\ ^2} の部分は、さらに変形すると、

 \frac{\bigl(n-1 \bigr)   \sum \frac{\bigl(X -  \overline{X}  \bigr) ^2}{n-1}}{\sigma\ ^2} = \sum \bigl( \frac{X - \overline{X}}{\sigma} \bigr) ^2

となり、Xが正規分布に従うならこれは \chi\ ^2 分布に従います*3。 つまりXが正規分布に従うとき検定統計量の分子はZ統計量、分母が \chi\ ^2 統計量をその自由度で除し平方根をとったものとなっています。このカタチはt統計量の定義そのものですから、母分散を不偏分散で置き換えた場合は検定統計量がt分布に従います。

サンプルサイズが大きいときはt分布は標準正規分布に分布収束するようですが、これはt統計量のどこを眺めればなぜそうなるのかわかるんですかね。

*1:標本平均の分散は無限母集団を仮定していて、もし有限母集団からの非復元抽出を考えた場合はこの値に \frac {N - n}{N-1}を乗じることになりますが。

*2:結論から言うとt分布に従います。

*3: \chi\ ^2 分布は標準正規分布に従う確率変数の二乗和が従う分布。