とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.23~連続型同時確率分布~

前回は離散型の同時確率分布でした。今回は連続型です。

同時確率分布とは

確率変数が2つある場合に、それぞれの確率変数がとる値とその確率の分布を合わせて表したもの。

今までは、確率変数が Xの一つしかありませんでした。しかし、今回は2つになったため、イメージとしては確率変数 X Yの2つを使って、目的変数である Zを求める感じです。

連続型同時確率分布

確率変数である X Yがそれぞれ同時確率変数である場合、 X Yの同時確率分布を表す関数を同時確率密度関数 f(x, y)という。

 a \leqq X \leqq bかつ c \leqq Y \leqq dとなる確率 P(a \leqq X \leqq b, c \leqq Y \leqq d)は、

 \displaystyle P(a \leqq X \leqq b, c \leqq Y \leqq d) = \iint f(x, y) \,\, dy \, dx

となります。この式では、 dy\,dxとあるように、 yの範囲を先に計算します。

また、 -\infty \leqq X \leqq \inftyかつ -\infty \leq Y \leqq \inftyの範囲で計算すると、

 \displaystyle P(-\infty \leqq X \leqq \infty, -\infty \leqq Y \leqq \infty) = \iint f(x, y) \,\, dy \, dx = 1

となります。

周辺確率密度関数

離散型でも見たように、ある確率変数を抜き出してその確率の総和を求めた関数のことを周辺確率密度関数と言います。

 xだけの関数を求める場合は、 yについて積分

 \displaystyle f_x(x) = \int_{-\infty} ^{\infty} f(x, y) dy

 yだけの関数を求める場合は、 xについて積分します。

 \displaystyle f_y(y) = \int_{-\infty} ^{\infty} f(x, y) dx

同時確率分布から確率を求める

 f(x, y) = x + y \,\,\,\,\, (0 \leqq x \leqq 1, 0 \leqq y \leqq 1)の時、 P(0 \leqq x \leqq \frac{1}{2}, 0 \leqq y \leqq \frac{1}{2}) を求めよ。ただし、 0 \leqq x \leqq 1, 0 \leqq y \leqq 1以外は f(x, y) = 0 である。


 \displaystyle P(0 \leqq x \leqq \frac{1}{2}, 0 \leqq y \leqq \frac{1}{2})

  \displaystyle = \iint_{0} ^{\frac{1}{2}} (x+y) \,\, dy\,dx

 \displaystyle = \int_{0} ^{\frac{1}{2}}  \left( \frac{1}{2}x + \frac{1}{8} \right) dx

 \displaystyle = \left [\frac{1}{4} x ^2 + \frac{1}{8} x \right ]_0 ^{\frac{1}{2}}

 \displaystyle = \frac{1}{16} + \frac{1}{16}

 \displaystyle = \frac{1}{8}

まとめ

まとめです。てか、まとめも「忙しい人」用にもなっていないという...。

用語 意味
同時確率密度関数  X Yの同時確率分布を表す関数
周辺確率密度関数 ある確率変数を抜き出してその確率の総和を求めた関数