統計学基礎vol.33〜母平均の信頼区間を求める(母分散が既知の場合)〜
今回の記事は母分散が既知の場合の、母平均の信頼区間の値を求めてみます。
正直な話、母平均が未知なのに、どうして母分散が分かるんだって気がしますが...。そういう特殊ケースがあるんでしょう、世の中には。
母平均の信頼区間~母分散が既知の場合~
手順として大きく4つになります。また、今回は信頼区間を例に見ていくことにしますが、信頼係数がでもでもやることは変わりません(途中の数値が変わるぐらいです)。
では、順に見ていきましょう。
1. 標本平均を求める
言葉の通りです。標本平均を求めます。仮に個のデータの標本平均を求める場合は、
となります。
2. 標本平均の標準化を行う
母平均は未知なのでとします。そして、(なぜか値が分かっている)母分散を、サンプルサイズをとすると(ここのは1で出てきたです)、標準化した値をで表して、
となります。
3. 標準正規分布表から上側2.5%点を求める
例によって、標準正規分布表から求めます。
ここで、なぜの信頼区間を求めるのに、ではなくなのかというと、上と下(正規分布で言えば、右端と左端)のを合わせるとになりますよね。
このように、信頼区間上と下の両側を調べることを両側検定と言い、反対に信頼区間の上もしくは下の片側一方だけを調べることを片側検定と言います。
(両側検定、片側検定の詳しい話に関しては後々解説することにします。今すぐ知りたい方は統計Webさんの23-6. 両側検定と片側検定を参照ください。)
では、標準正規分布表から面積がとなるの値を探してみましょう。
標準正規分布表では、0~までの確率(積分値)を求めています。一方で、私たちが求めたいのは下図の赤い矢印が指す部分です。
このとき、赤い矢印の部分の確率はなので、標準正規分布表では反対にとなるの値を求めればよいです。
よって、標準正規分布表からとなるの値は
となります。図で表すと下の色のついた範囲がになります。
式で表すと下記になります。
4. 信頼区間を求める
3から、上側のの値は(下側のの値は)と分かりました。ここで、母平均のの範囲を知りたいので、その範囲をで表すと、
となります。
さて、ここで問題に立ち返ると、我々は信頼区間の母平均の値を知りたいです。そのため、上式を母平均について解かないといけません。
ここで、
としていたので、これを代入してについて解けば良さそうです。
について解くとこのようになりました。ここで、、、はすべて既知の値であるため、母平均の値を求めることができます。
一般化する
今回、信頼係数がというもとで、信頼区間の求め方の手順を見てきました。ここで、最後の手順4で出てきた展開式を一般的に表してみることにします。
信頼係数を()とすると、標準正規分布の上側確率は
と表現できます。この時のの値をで表すと、最後の手順4で出てきた展開式は以下のように表せます。
信頼区間であれば、となります。
ちなみに信頼区間であれば、となります。
区間推定の特徴(母分散が既知)
信頼区間の幅は、
信頼係数が小さいときほど、
また
サンプルサイズが大きいほど
狭くなります。
まとめ
今回の記事のまとめです。
~母分散既知の母平均の信頼区間の手順~
~信頼区間の特徴~
信頼係数が小さいほど、また、サンプルサイズが大きいほど狭くなる