とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.22~離散型同時確率分布~

ブログを全く更新していなくて申し訳ありません。

気づいたら、2週間ほどあいていたことに私自身もびっくりです。

同時確率分布とは

確率変数が2つある場合に、それぞれの確率変数がとる値とその確率の分布を合わせて表したもの。

今までは、確率変数が Xの一つしかありませんでした。しかし、今回は2つになったため、イメージとしては確率変数 X Yの2つを使って、目的変数である Zを求める感じです。

離散型同時確率分布

 X x_i Y y_iを取るときの同時確率分布

 f(x_i, y_i) = P(X = x_i, Y = y_i) \,\,\, (i=1, 2, 3, \dots)


また、

 \sum_i \sum_j f(x_i, y_i) = 1

周辺確率分布

ある確率変数を抜き出して、その確率の総和を求めたものを周辺確率分布という。

同時確率分布で言えば、確率変数の Xもしくは、 Yのどちらか一方だけに注目して分布をみる感じです。

 f(x_i, y_i) = P(X = x_i, Y = y_i)で、 Yの総和を取ると、

 f(x_i) = \sum_j f(x_i, y_j) = P(X = x_i)

 Xの総和を取ると、

 f(y_j) = \sum_j f(x_i, y_j) = P(Y = y_j)

が求められます。それぞれの f(x_i) f(y_j)のことを周辺確率関数と言います。

まとめ

久々ということもあり、また、連続型の同時確率分布も含めると結構なボリュームになりそうなので、一旦ここで切ります。
次回、連続型の同時確率分布を扱います。

用語 意味
同時確率分布 確率変数が2つある場合に、それぞれの確率変数がとる値とその確率の分布を合わせて表した分布
離散型同時確率分布  X x_i Y y_iを取るときの同時確率分布
周辺確率分布 ある確率変数を抜き出して、その確率の総和を求めたもの
周辺確率関数 ある確率変数を抜き出して、その確率の総和を求めたときの関数