とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.14~ベルヌーイ試行と二項分布~

いよいよこの記事から分布の話に入ります。はりきっていきましょう!

ベルヌーイ試行

何かを行ったときに起こる結果が2つしかない試行のこと

2つの結果のうち、一方を成功とし、その時の確率変数  Xがとる値を1とする。また、もう一方の結果を失敗とし、その時の確率変数Xがとる値を0とする。成功の確率を p(0 \leqq  p \leqq 1)とすると、

 P(X = 1) = p

 P(X = 0) = 1-p

となる。

これだけですね。特筆すべきことも特にありません。ちなみに、ベルヌーイ試行の試行回数は1回のみです。

二項分布

ベルヌーイ試行を n回行なって、成功する回数 Xが従う確率分布のこと。 Xが二項分布に従うとき、

 X ~ B(n, p)

と書きます。Bは二項分布の Binomial \, distributionから来ています。ここで、 n pはパラメータです。統計学におけるパラメータとは母集団が持つ固有の統計量のことです。イメージとしては、パラメータとは、値が決まればその分布の形を決めるものという感じでしょうか。

ここで、 n回の(ベルヌーイ)試行を行うときにちょうど k回成功する確率 P(X = k)は、

 P(X = k) = {}_n C_k \, p ^k (1-p)^{n-k}

で表せます。ただし、 k = 0, 1, 2, \dots, nです。ここで、 {}_n C_kはコンビネーションの計算を表します(最近だと Cを書かずに列ベクトルのように書くらしいですね。そのうち、組み合わせの書き方で年齢が分かるような時期が来るのでしょうか?)。

二項分布の期待値と分散

二項分布の期待値や分散の導出に関しては他の記事を参考にしてもらうとして。

ここでは、結果だけをお見せします。また、今後も分布の紹介をしますが、基本的には導出まではやらず期待値と分散の結果だけを述べることにします。

期待値

E[X] = np

分散

 V[X] = np(1-p)

練習問題

最後に軽く問題を解いてみましょう。

問題
1000コ中120コがあたりのくじがある。この時の期待値と分散を求めよ。

解答

あたり120コ、はずれ880コ、総数1000コの二項分布 \displaystyle B(1000, \frac{120}{1000})より、

 \displaystyle E[X] = np = 1000 \times \frac{120}{1000} = 120

 \displaystyle V[X] = np(1-p) = 1000 \times \frac{120}{1000} \times \frac{880}{1000}= 105.6

ちなみに、このくじから10回引く場合の期待値と分散は\displaystyle B(10, \frac{120}{1000})より、

 \displaystyle E[X] = np = 1000 \times \frac{120}{1000} = 1.2

 \displaystyle V[X] = np(1-p) = 1000 \times \frac{120}{1000} \times \frac{880}{1000}= 1.056

となります。

まとめ

用語 意味
ベルヌーイ試行 何かを行ったときに起こる結果が2つしかない試行のこと
二項分布 ベルヌーイ試行を n回行なって、成功する回数 Xが従う確率分布のこと
パラメータ 母集団が持つ固有の統計量のこと
二項分布の表し方  X ~ B(n, p)
二項分布の確率  P(X = k) = {}_n C_k \, p ^k (1-p)^{n-k}
二項分布の期待値 E[X] = np
二項分布の分散  V[X] = np(1-p)