リーマンの勉強記録

資格試験の記録用にはじめました。

統計検定2級(7)

さて、夜更かしして2015年9月の過去問を解いてみました。

84分かけて正答率82%でした。

最初の3問を立て続けに間違えてしまい記述統計苦手か!と突っ込みたくなりましたが、どうやらエンジンがかかるのが遅いようで前半の、時間をかければ絶対にできるはずの問題で慌ててしまい落としています。

あとANOVAを全くノーマークだったので(いまさら試験範囲だと知った)全問落としましたが、本番じゃなくてよかったです。

優秀賞は危ういですね。

 

統計検定2級(6)

今日はちょっと古いですが2014年6月の過去問を解きました。71分で解き終わり正答率84%という結果です。

やや問題が簡単な印象を受けましたが、それでもケアレスミスをしてしまったので本番では確認必須ですね。

「合成した分散」は完全に勘違いしていたので危なかったです。

明日も一回分解いてみて本番を迎えようと思います。

統計検定2級(5)

ペースアップが必要と言いながらペースダウンしていました。

突然ですが信頼区間って勘違いしやすいですよね。一度のサンプリングで得た標本から推定した1-α%信頼区間に母数の入る確率が1-α%、と言いたいところですけど実際は上下α/2%点が確率変数なので信頼区間の方が動くことに気をつけないとダメですね。ちなみにt統計量を使うときの上下α/2%点てどんな分布に従うんですかね。

さて勉強の方ですが、時間もはからずダラダラと過去問を解いてみて、なんとなく8割くらいはとれそうです。どうも計算ミスや時間配分ミスなどで落としてしまいそうなので追加的に得点するためには試験形式での訓練が必要な感じがします。

統計検定2級(4)

t分布の分布収束は密度関数の極限とればいい話でしたね。

さて、勉強ですが引き続き仮説検定まわりをやっていました。ある程度思い出してきたので、そろそろ過去問を解いてみようと思います。受験票も届いたので少しペースアップしないと間に合わなさそうですね。

統計検定2級(3)

今日は(母平均の検定を意識して)検定統計量の勉強をしました。内容を整理しておきたいと思います。

まず、ある確率分布に従う確率変数Xの標本平均を\overline{X}と書くと、それを標準化した確率変数Zは

 Z = \frac { \overline{X} - E(\overline{X}) }{\sqrt{V(X)}}

です。標本平均の平均は母平均 \mu、標本平均の分散は母分散 \sigma\ ^2をサンプルサイズnで割ったものとなるので*1

 Z =  \frac { \overline{X} - \mu\ }{\sqrt{ \frac{ \sigma\ ^2}{n} }}

です。「ある確率分布」が正規分布であるならZは標準正規分布に従うので、母分散が既知であれば「母平均 \muがいくらである」といった帰無仮説を立ててZ検定すれば母平均の検定ができます。

母分散が既知というケースは稀です。母分散 \sigma\ ^2が未知の場合は、代わりに標本から計算した不偏分散 s ^2を使い、

  \frac { \overline{X} - \mu\ }{\sqrt{ \frac{ s ^2}{n}}}

を検定統計量とします。ただし、もはやこの統計量がどのような分布に従うかはわからないので*2、上の統計量を変形して

  \frac {\frac { \overline{X} - \mu\ }{\sqrt{ \frac{  \sigma\ ^2}{n}}}}{ \sqrt{\frac{ s ^2}{\sigma\ ^2}}} =
\frac{ \frac{ \overline{X} - \mu\ }{ \sqrt{ \frac{  \sigma\ ^2}{n}}}}{ \sqrt{\frac{ (n-1) s ^2}{\sigma\ ^2} / (n-1) }}

を得ます。分子はZ統計量なのでXが正規分布に従うならこれは標準正規分布に従います。分母の \frac{ (n-1) s ^2}{\sigma\ ^2} の部分は、さらに変形すると、

 \frac{\bigl(n-1 \bigr)   \sum \frac{\bigl(X -  \overline{X}  \bigr) ^2}{n-1}}{\sigma\ ^2} = \sum \bigl( \frac{X - \overline{X}}{\sigma} \bigr) ^2

となり、Xが正規分布に従うならこれは \chi\ ^2 分布に従います*3。 つまりXが正規分布に従うとき検定統計量の分子はZ統計量、分母が \chi\ ^2 統計量をその自由度で除し平方根をとったものとなっています。このカタチはt統計量の定義そのものですから、母分散を不偏分散で置き換えた場合は検定統計量がt分布に従います。

サンプルサイズが大きいときはt分布は標準正規分布に分布収束するようですが、これはt統計量のどこを眺めればなぜそうなるのかわかるんですかね。

*1:標本平均の分散は無限母集団を仮定していて、もし有限母集団からの非復元抽出を考えた場合はこの値に \frac {N - n}{N-1}を乗じることになりますが。

*2:結論から言うとt分布に従います。

*3: \chi\ ^2 分布は標準正規分布に従う確率変数の二乗和が従う分布。

統計検定2級(2)

2014-2016年の過去問本が手元にあるので、とりあえず昨夜は手始めに適合度・独立性の検定の問題だけ抜き出して勉強することに。

基本的には、

・期待度数

・χ^2統計量とその分布の自由度

帰無仮説が何か

を知っていれば解けそう。ただし2014年11月の問題のように平均値から分布のパラメータを推定してるような場合は自由度が更に1減るので要注意。

この調子で仮説検定まわりを勉強しようと思います。

 

統計検定2級(1)

久々の更新です。統計検定2級の申込みをしていたにも関わらずほとんどノータッチでしたので、そろそろなにか勉強を始めようと思います。

あと三週間もないですがどこから手をつけていいのやら。とりあえず出題範囲を確認して、やりたいところから始めようと思います。

仮説検定とか推測統計からやりましょうかね。