知らないうちに4月になりましたね。そして4月が終わりましたね...。
この統計学基礎はいつになったら終わるのでしょうか?
今年中に終われば奇跡ってところですかね?
さてさて、今回は母比率の検定です。
母比率とは?
母集団の比率のことです。そのまんまといえばそのまんまですね。
で、ちょっと話が逸れるのですが、今までの検定の話は母集団が正規分布に従うことが必要な条件でした。
しかし、中心極限定理というものを使えば、母集団が正規分布に従わない場合でも標本が十分に大きい場合は標本平均の分布は正規分布に従うことが言えました。
よって、この中心極限定理を使うことで母集団が正規分布に従わなくても標準正規分布を用いて検定を行うことができます。
ということで、中心極限定理を利用して母集団が正規分布に従わなくても検定が行えることを実際に見ていきましょう。
例題
あるサイコロを12000回投げた時、1が2200回出た。このサイコロはどの目も等しく出る歪みのないサイコロと言えるか?
解答
仮に歪みのないサイコロであるなら、1〜6がほぼ等しく出るはずなので1の目が出る確率は
となるはずです。今回12000回投げたのであれば1が出る回数は理論上は2000回になるはずですが...?
1 仮説を立てる
帰無仮説:このサイコロの1が出る確率である
対立仮説:このサイコロの1が出る確率である
2 有意水準を設定
とします。
3 適切な検定統計量を決める
さて、母比率の検定ではサンプルサイズが十分に大きい場合、中心極限定理を利用して標準化した統計量を以下のように表現できます。ここでは母比率です。
ここの式ですが、色々すっ飛ばしているので丁寧に見ていくことにしましょう。
まず、仮説の方を振り返って考えてみると「サイコロの1がの確率で出るか出ないか」とも読み取れます。
つまり、の2項分布と考えることができます。
ということで、の期待値と分散は
と計算出来ます。
ここでサンプルサイズは十分大きいとき、中心極限定理よりはの標準正規分布に従います。
よって、統計量は2項分布から、
ここで、とすると、
となります。これを計算すると、
となります。
以上、統計量を計算出来ました。
4 棄却ルールを決める
中心極限定理から、この検定で使用する分布は標準正規分布です。今回、サイコロの1の目の出方に歪みがないかどうかを確認したいため、両側検定を行います。
この時、統計数値表からの値は
となります。
5 検定統計量をもとに結論を出す
今まで求めた情報を元にすると以下の図のようになります。
より統計量は棄却域に入りました。
よって、有意水準において、帰無仮説を棄却し対立仮説を採択します。
よって、このサイコロの1の目が出る確率はではないと結論づけられます。
まとめ
用語 | 意味 |
---|---|
母比率 | 母集団の比率のこと |