統計検定2級(3)
今日は(母平均の検定を意識して)検定統計量の勉強をしました。内容を整理しておきたいと思います。
まず、ある確率分布に従う確率変数Xの標本平均をと書くと、それを標準化した確率変数Zは
です。標本平均の平均は母平均、標本平均の分散は母分散をサンプルサイズnで割ったものとなるので*1、
です。「ある確率分布」が正規分布であるならZは標準正規分布に従うので、母分散が既知であれば「母平均がいくらである」といった帰無仮説を立ててZ検定すれば母平均の検定ができます。
母分散が既知というケースは稀です。母分散が未知の場合は、代わりに標本から計算した不偏分散を使い、
を検定統計量とします。ただし、もはやこの統計量がどのような分布に従うかはわからないので*2、上の統計量を変形して
を得ます。分子はZ統計量なのでXが正規分布に従うならこれは標準正規分布に従います。分母のの部分は、さらに変形すると、
となり、Xが正規分布に従うならこれは分布に従います*3。 つまりXが正規分布に従うとき検定統計量の分子はZ統計量、分母が統計量をその自由度で除し平方根をとったものとなっています。このカタチはt統計量の定義そのものですから、母分散を不偏分散で置き換えた場合は検定統計量がt分布に従います。
サンプルサイズが大きいときはt分布は標準正規分布に分布収束するようですが、これはt統計量のどこを眺めればなぜそうなるのかわかるんですかね。