前回、母比率の信頼区間を簡単に説明しましたが、そこそこ難しいので練習問題を3題ほど載せて解説します。(いずれも統計Webさんからですが)
ちなみに、投稿頻度が少なくなっているのはたまたまです。
問題1〜信頼区間の幅を求める場合
テレビ番組の視聴に関する該当アンケートを行った。100人にアンケートを行うと、A番組を見ている人はだった時、A番組の視聴率の信頼区間はいくらか?
解説1
問題文から条件を読み取ると、、となります。
ここで、
を使います。つまり、
となります。(ただし、は )
ここでの信頼区間であることから、または一致推定量であることからをと置き換えることができるので、
となります。
これを計算すると、
よって、A番組の視聴率の信頼区間は〜となります。
イメージとしては下の図のようになります。図ではと書いてますが、全てに読み替えてください。
問題2〜サンプルサイズを求める場合
テレビ番組の視聴に関する該当アンケートで信頼係数をとし、A番組の視聴率が信頼区間で含まれる範囲(信頼区間の幅)を以下にするには何人以上の人にアンケートを実施する必要があるか?ただし、A番組の視聴率は以下である。
解説2
問題1では真のA番組の視聴率(要は母比率)の信頼区間の幅を求める問題でした。一方、問題2はサンプルサイズを求める問題です。
A番組の視聴率の推定値は、母比率を、サンプルサイズをとします。
ここで、が信頼区間に含まれる範囲は
です。
この時、問題文からが信頼区間に含まれる範囲を以下にすることを考えると、より
となれば、が信頼区間に含まれる範囲を以下にすることができます。
よって、
を計算すれば良いことになります。ここで、であとは上の式をについて解けば良いので、
<
よって554人以上にアンケートを行えば、理論上、A番組の視聴率が信頼区間で含まれる範囲以下にすることができます。
問題3〜標本比率が不明の場合
ある比率を調査し、区間推定を行う。信頼区間の幅をに収める場合、どの程度サンプルサイズを確保すれば良いか。
解説3
問題文から信頼区間の幅がなので、標本比率を、母比率をとした場合、解説2から
より、
となっていれば良いことになります。
ここで、は問題文から読み取ることができません。このようの場合はとして計算を進めます。
なぜ、を採用するかというと、
上記2つの理由のためです。
よって、として、上記式を計算すると、
よって、以上のサンプルサイズを確保すれば良いことになります。
まとめ
まとめと言っても特にまとめることもないのですが...。
なんにせよ、ある道具を使いこなしたい(英語が話せるようになりたいとか、プログラミングできるようになりたいなど)のであれば、ただ座学として学ぶだけでは身につきません。
実践していくことが非常に重要だと思いますので、何度でも練習して着実に理解し、実際の現場でちゃんと使えるようにしておきましょう。
向き不向きはありますが、理解→実践の順だけで学ぶのではなく、実践→理解という順で学んでみるのも一つの勉強法だと思います。