とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.19~指数分布~

久々の統計学です。
ブログ自体は時々更新していたんですが、まさか統計学がおろそかになるとは思いませんでした。
何はともあれ、今回は指数分布です。

指数分布とは

連続型確率分布の一つ。
機械が故障してから次に故障するまでの期間や、災害が起こってから次に災害が起こるまでの期間のように

次に何かが起こるまでの期間が従う分布

のことを言う。
また、確率変数 Xが指数分布に従っているとき、

 X ~  Ex(\lambda)

と書く。

指数分布の式

ある期間に平均して \lambda回起こる現象 (\lambda >  0)があり、次に起こるまでの期間 Xが指数分布に従うとき、

 \displaystyle f(x) = \lambda \exp(-\lambda x)

と書ける。ただし、上式は x \geqq 0の場合。

 x <   0の時、

 \displaystyle f(x) = 0

である。

指数分布の期待値と分散

期待値

\displaystyle E[X] = \frac{1}{\lambda}

分散

\displaystyle V[X] = \frac{1}{\lambda ^2}

指数分布の使い方

指数分布は、次に何かが起こるまでの期間を確率で表します。例えば、1時間に平均して10人が来店するお店で、ある客が来てから次の客が来るまでの時間が5分となる確率などです。これの詳しい計算方法は統計Webさんに預けます。

1時間に平均して10人が来店するお店で、ある客が来てから次の客が来るまでの時間が5分となる確率

一方で、ある期間に平均して \lambda回起こる現象が起こるまでの期間を Xとしたとき、期間 X

 x以下

となる確率も求めることが出来ます。

この場合の確率は、

 xまでの累積分布関数 F(x)

で計算可能です。

具体的に見てみましょう。

例えば、先ほどの例のように1時間に平均10人が来る店に、ある客が来てから次の客がくるまでの時間が5分以内となる確率は、下図の灰色の部分の面積になります。 \lambda = 10、5分で来ることから\displaystyle x = \frac{5}{60} = \frac{1}{12}となります。また、5[分]を1/12[時間]に直したのは、 \lambdaと単位を合わせるためです。

f:id:kurasher:20200912002510p:plain

この灰色の部分は、0分から5分の間を積分(指数分布は連続型の分布のため)すれば求められそうですね。
そうすると、

\displaystyle F(x) =\int_{-\infty} ^{x} f(t) \,\, dt

\displaystyle = \int_{0} ^{x} \lambda \exp(-\lambda t) \,\, dt

 \displaystyle = \lambda \left[ -\frac{1}{\lambda} \exp(-\lambda t)\right]_{0} ^{x}

= -\exp(-\lambda x) + 1

 = 1 - \exp(-\lambda x)

となります。ここで、ある客が来てから次の客がくるまでの時間が5分以内となる確率を求めるので、

 \displaystyle F(x) = P(X \leqq \frac{1}{12})

 \displaystyle = 1 - \exp(-10 \times \frac{1}{12})

  = 0.565

と、求めることが出来ます。

また、ある客が来てから次の客がくるまでの時間が5分以内となる確率が分かるということは、ある客が来てから次の客がくるまでの時間が5分以上となる確率も求めることが可能です。

下の図から、灰色の部分が、ある客が来てから次の客が来るまでの時間が5分以内となる確率でした。
ということは、残りの白い部分の面積が、ある客が来てから次の客がくるまでの時間が5分以上となる確率を表すことになります。

f:id:kurasher:20200912002510p:plain

すなわち、

\displaystyle  F(x) = P(X \geqq \frac{1}{12})

 \displaystyle = 1 - P(X \leqq \frac{1}{12})

  = 1 -  0.565 = 0.435


と計算できるわけですね。

コラム:指数分布とポアソン分布の違い

指数分布とポアソン分布は非常に似ています。
どちらもある期間に平均して \lambda回起こる現象というところまでは一緒です。が、

指数分布:次に起こるまでの期間に関する分布
ポアソン分布:ある期間に起こる回数に関する分布
という違いがあります。



これといった覚え方はないのですが、

指数分布   → 連続型の分布 → 期間、時間に関するもの
ポアソン分布 → 離散型の分布 → 回数に関するもの

という感じでしょうか?

まとめ

今回は指数分布についてまとめました。ついでなので、ポアソン分布もまとめておきます。

用語 意味
指数分布 次に何かが起こるまでの期間が従う分布
指数分布の表し方  X ~  Ex(\lambda)
指数分布の期待値 \displaystyle E[X] = \frac{1}{\lambda}
指数分布の分散 \displaystyle V[X] = \frac{1}{\lambda ^2}
--- ---
ポアソン分布 ある期間に平均 \lambda回起こる現象が、ある期間に X回起きる確率を表した分布
ポアソン分布の表し方  X~Po(\lambda)
ポアソン分布の確率 \displaystyle P(X = k) = \exp(- \lambda) \frac{\lambda ^k }{k!}
ポアソン分布の期待値  E[X] = \lambda
ポアソン分布の分散  V[X] = \lambda