とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.20~離散一様分布~

今回は一様分布です。一番有名で身近な一様分布って実は裏・表のあるコインだったりして。

一様分布とは

全ての事象が起こる確率が等しい分布のこと。
イメージしやすいのはサイコロでしょうか。
サイコロは形がいびつなものでない限りはどの目が出る確率も \displaystyle \frac{1}{6}になります。

一様分布には離散と連続の場合がありますが、今回は離散一様分布だけ取り上げます。連続分布は次回あたりに。

離散一様分布の式

離散一様分布は次の式で表される。

\displaystyle P(X = k) = \frac{1}{N}

ただし、 k = 1, 2, \dots, Nである。
 N = 6の時は、我々がよく知るサイコロですね。

離散一様分布の期待値と分散

一様分布に関しては簡単なので、求めてみましょう。

期待値

\displaystyle E[X] = \sum_{i=1} ^{N} i\times \frac{1}{N}

 \displaystyle = \frac{1}{N} \sum_{i=1} ^{N} i

 \displaystyle = \frac{1}{N} \times \frac{N(N+1)}{2}

 \displaystyle = \frac{N+1}{2}

分散

分散も求めてみましょう。

まずは分散の定義から。

 V[X] = E[(X - E[X]) ^2]

 V[X] = E[X ^2] - (E[X]) ^2

 E[X]は求めているので、 E[X ^2]を求めましょう。

\displaystyle E[X ^2] = \sum_{i=1} ^{N} i ^2 \frac{1}{N}

\displaystyle = \frac{1}{N} \sum_{i=1} ^{N} i ^2

\displaystyle = \frac{1}{N} \times \frac{N(N+1)(2N+1)}{6}

 \displaystyle = \frac{(N+1)(2N+1)}{6}

よって、

 V[X] =  E[X ^2] - (E[X]) ^2

\displaystyle = \frac{(N+1)(2N+1)}{6} - \left( \frac{N+1}{2} \right) ^2

 \displaystyle = \frac{N+1}{12} \{2(2N+1)-3(N+1)\}

 \displaystyle = \frac{N+1}{12} (4N+2-3N-3)

 \displaystyle = \frac{N+1}{12} \times (N-1)

 \displaystyle = \frac{N ^2 - 1}{12}

kが1から始まらないときの離散一様分布

考えてみれば当たり前のような気がしますが、 kの始まりが常に1とは限りません。その場合の一様分布の式と、期待値、分散を見てみましょう。

\displaystyle P(X = k) = \frac{1}{b-a+1}

ただし、 k = a, a+1, \dots, bである。

kが1から始まらないときの期待値

\displaystyle E[X] = \sum_{i=a} ^{b} \frac{i}{b-a+1}

ここで、始めの値が a、終わりの値が bで、数値が N個あるので、

\displaystyle \sum_{i=a} ^{b} i = \frac{(b-a+1)(b + a)}{2}

とできます。なぜ上のように計算できるかというのは、高校数学の美しい物語~等差数列の和の公式の例題と証明など~の視点1:台形バージョンに書かれています。

高校数学の美しい物語~視点1:台形バージョン

(種明かしすれば、等差数列の初項を a_1、末項を a_l、初項から末項までの数値の個数が nの時、
 \displaystyle \frac{n(a_1 + a_l)}{2}

と表せます。)

というわけで、期待値は、

\displaystyle E[X] = \sum_{i=a} ^{b} \frac{i}{b-a+1}

 \displaystyle = \frac{1}{b-a+1} \times \frac{(b-a+1)(b + a)}{2}

 \displaystyle = \frac{a + b}{2}

となります。

kが1から始まらないときの分散

 V[X] = E[X ^2] - (E[X]) ^2

 \displaystyle = \frac{(b-a+1) ^2 -1}{12}

です。

この分散ですが、 k=1から始まるときと k=1から始まらないときとで、違いをよくよく観察してみると、 N = b-a+1に置き換わっていますね。

まとめ

今回は(離散)一様分布でした。次回は連続一様分布ですね。

用語 意味
一様分布 全ての事象が起こる確率が等しい分布
 k = 1, 2, \dots, Nの時
一様分布の式 \displaystyle P(X = k) = \frac{1}{N}
離散一様分布の期待値 \displaystyle E[X] = \frac{N+1}{2}
離散一様分布の分散 \displaystyle V[X] = \frac{N ^2 - 1}{12}
 k = a, a+1, \dots, bの時
一様分布の式 \displaystyle P(X = k) = \frac{1}{b-a+1}
離散一様分布の期待値 \displaystyle E[X] = \frac{a+b}{2}
離散一様分布の分散 \displaystyle V[X] = \frac{(b-a+1) ^2 - 1}{12}