突然ですが信頼区間って勘違いしやすいですよね。一度のサンプリングで得た標本から推定した1-α％信頼区間に母数の入る確率が1-α％、と言いたいところですけど実際は上下α/2％点が確率変数なので信頼区間の方が動くことに気をつけないとダメですね。ちなみにt統計量を使うときの上下α/2％点てどんな分布に従うんですかね。

さて勉強の方ですが、時間もはからずダラダラと過去問を解いてみて、なんとなく8割くらいはとれそうです。どうも計算ミスや時間配分ミスなどで落としてしまいそうなので追加的に得点するためには試験形式での訓練が必要な感じがします。

2018-06-02

統計検定2級（4）

統計検定2級

t分布の分布収束は密度関数の極限とればいい話でしたね。

さて、勉強ですが引き続き仮説検定まわりをやっていました。ある程度思い出してきたので、そろそろ過去問を解いてみようと思います。受験票も届いたので少しペースアップしないと間に合わなさそうですね。

2018-05-31

統計検定2級（3）

統計検定2級

今日は（母平均の検定を意識して）検定統計量の勉強をしました。内容を整理しておきたいと思います。

まず、ある確率分布に従う確率変数Xの標本平均を $\overline{X}$ と書くと、それを標準化した確率変数Zは

$Z = \frac { \overline{X} - E(\overline{X}) }{\sqrt{V(X)}}$

です。標本平均の平均は母平均 $\mu$ 、標本平均の分散は母分散 $\sigma\ ^2$ をサンプルサイズnで割ったものとなるので*1、

$Z = \frac { \overline{X} - \mu\ }{\sqrt{ \frac{ \sigma\ ^2}{n} }}$

です。「ある確率分布」が正規分布であるならZは標準正規分布に従うので、母分散が既知であれば「母平均 $\mu$ がいくらである」といった帰無仮説を立ててZ検定すれば母平均の検定ができます。

母分散が既知というケースは稀です。母分散 $\sigma\ ^2$ が未知の場合は、代わりに標本から計算した不偏分散 $s ^2$ を使い、

$\frac { \overline{X} - \mu\ }{\sqrt{ \frac{ s ^2}{n}}}$

を検定統計量とします。ただし、もはやこの統計量がどのような分布に従うかはわからないので*2、上の統計量を変形して

$\frac {\frac { \overline{X} - \mu\ }{\sqrt{ \frac{ \sigma\ ^2}{n}}}}{ \sqrt{\frac{ s ^2}{\sigma\ ^2}}} = \frac{ \frac{ \overline{X} - \mu\ }{ \sqrt{ \frac{ \sigma\ ^2}{n}}}}{ \sqrt{\frac{ (n-1) s ^2}{\sigma\ ^2} / (n-1) }}$

を得ます。分子はZ統計量なのでXが正規分布に従うならこれは標準正規分布に従います。分母の $\frac{ (n-1) s ^2}{\sigma\ ^2}$ の部分は、さらに変形すると、

$\frac{\bigl(n-1 \bigr) \sum \frac{\bigl(X - \overline{X} \bigr) ^2}{n-1}}{\sigma\ ^2} = \sum \bigl( \frac{X - \overline{X}}{\sigma} \bigr) ^2$

となり、Xが正規分布に従うならこれは $\chi\ ^2$ 分布に従います*3。つまりXが正規分布に従うとき検定統計量の分子はZ統計量、分母が $\chi\ ^2$ 統計量をその自由度で除し平方根をとったものとなっています。このカタチはt統計量の定義そのものですから、母分散を不偏分散で置き換えた場合は検定統計量がt分布に従います。