とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.10~確率変数と確率分布~

良いサブタイトルが分からず、こんな分かりにくいサブタイトルになりました。お許しください....。

確率変数

ある変数の値を取る確率が存在する変数のこと。

サイコロを例にとります。サイコロの出る目を Xとします。

この時、 X \{1, 2, 3, 4, 5, 6\}です。これを確率で表すと

 \displaystyle P(X) = \frac{1}{6}

であり、この時の Xを確率変数と言います。

確率分布

確率変数の値に対して、その確率変数を取る確率の分布を表現するもの。

サイコロを例にした場合、以下のような表になります。

サイコロの目 1 2 3 4 5 6
確率  \displaystyle \frac{1}{6}  \displaystyle \frac{1}{6}  \displaystyle \frac{1}{6}  \displaystyle \frac{1}{6}  \displaystyle \frac{1}{6}  \displaystyle \frac{1}{6}

サイコロの場合、各目(確率変数)に対して確率 \frac{1}{6}が対応しているため、サイコロは確率分布と言えます。

ちなみに、どの目に対しても一様な確率であることから、サイコロの目は一様分布であるともいえます。

離散型と連続型

次に、確率変数が離散型か連続型かで説明を行います。その前に、そもそも離散型と連続型の違いは何なのか、簡単にイメージを持ってもらいます。

離散型の確率変数というのはいわゆる、確率変数の値が飛び飛びのものです。代表的な例で言えば、サイコロの目、コインの表、裏などがあります。反対に、連続型の確率変数はというと、確率変数の値が途切れなく続くものです。代表的な例としては、体重や、身長などがあります。

ここで、確率変数という言葉を除いた、離散型と連続型について考えてみましょう。離散型というのは、値が飛び飛びのものです。最たる例で言えば、デジタル時計がそれにあたります。

デジタル時計は、多くの場合100分の1秒までを表示します。さらに細かい、1,000分の1秒や、10,000分の1秒を表示することはできません。つまり、100分の1秒ごとに値が途切れているわけです。

一方、連続型というのは、値が途切れなく続いています。これはアナログ時計にあたります。アナログ時計の場合、秒針がついています。その秒針は、我々が認識することはほぼ不可能なぐらい一瞬ですが、1,000分の1秒や、10,000分の1秒を表示しています。このように、値が途切れなく続いているものが連続にあたります。

理解が難しい場合、以下のような認識を持ってもらえれば大丈夫です(多少無理やり感がありますが)。

ある点からある点に向けて線を引くとき、線が途切れれば離散、線が途切れなければ連続である。

離散型

まずは確率変数が離散型から。

離散型確率変数

飛び飛びの値を取る変数のことで、隣り合う数字の間には値が存在しない。

離散型確率分布

確率変数が離散型である場合の確率分布
例. 2項分布、幾何分布、ポアソン分布など

確率質量関数

離散型確率変数 Xがある値 xの時の確率を関数 f(x)と表したもの。

 f(x) = P(X = x)

また、

 \displaystyle \sum_{i = 1}^{n} P(X = x_i) = 1

である(確率変数Xの要素の全ての確率を足せば1( 100\%)になるよね、という話です)。

例示

サイコロで例を示しましょう。  X = \{1, 2, 3, 4, 5, 6\}で、 x = 3(3の目が出る事象)を表す場合、

 \displaystyle f(3) = P(X = 3) = \frac{1}{6}

となります。また、 x_iの添え字の iがサイコロの目と対応しているとすれば、

 \displaystyle \sum_{i = 1}^{6} P(X = x_i) = P(X = x_1)  + P(X = x_2)  +\dots + P(X = x_6)

 = P(X = 1)  + P(X = 2)  +\dots + P(X = 6)

 \displaystyle = \frac{1}{6}  + \frac{1}{6}  +\dots + \frac{1}{6}

 = 1

連続型

次に確率変数が連続型の場合です。

連続型確率変数

重さや温度などのように連続した値を取るもの。値同士の間に途切れが無いモノという認識で大丈夫です。

連続型確率分布

確率変数が連続型である場合の確率分布。
例. 一様分布、指数分布、正規分布など

確率密度関数

連続型確率変数 Xがある値 xを取る確率密度を関数 f(x)として表したもの。

 f(x) = f(X = x)

また、ある確率密度関数 f(x)において、 a \leqq x \leqq bとなる確率は、

 \displaystyle P(a \leqq X \leqq b) = \int_{a}^{b} f(x) \,\, dx

と計算できる。また、

 \displaystyle  \int_{-\infty}^{\infty} f(x) \,\, dx = 1

である(離散型の確率質量関数で見たのと一緒で、端から端まで足せば確率の値は1になるよね、という話です)。

※連続型確率変数の場合、確率密度を計算するため、場合によっては f(x) \geqq 1となることもあります。

上の式で積分の計算をしている、ということは、面積を計算していると言えます。

つまり、連続型確率変数の確率は面積で表されるのです。ちょうど下の色のついた部分が a \leqq x \leqq bの確率にあたります。
f:id:kurasher:20200603233225p:plain

普段「面積を確率とみなす」ことに馴染みが無いので、あまりピンとこないと思いますが。

例示

連続型の例示として(正しいかどうかは分かりませんが)、洗濯機が壊れる日というのを考えてみます。洗濯機が壊れる時間というのは、例えば10年と33日の4時間23分55.90324....秒のように連続です。そのため、洗濯機が壊れる時間を連続型確率変数と考えることが出来ます。

この時、洗濯機を買ってから3年目~6年目の間に壊れる確率は

 \displaystyle P(3 \leqq X \leqq 6) = \int_{3}^{6} f(x) \,\, dx

で表されます。

また、洗濯機は時間を無限大にすればいずれ壊れますので(負の時間は考えないものとする)、

 \displaystyle  \int_{-\infty}^{\infty} f(x) \,\, dx

 \displaystyle = \int_{0}^{\infty} f(x) \,\, dx = 1

となりますね。

例題. 確率密度関数 f(x)からある範囲の確率をもとめてみよう

確率密度関数 f(x)

 f(x) = c  \,\,\,\,\,\, ( 0 \leqq x \leqq 6)

 f(x) = 0  \,\,\,\,\,\, ( otherwise)

と定義する( cは定数)。このとき、 2 \leqq X \leqq 3の確率を求めよ。

上の例題を難しくしたものは、統計検定2級に普通にでてきます。統計検定2級を目指す人は気を付けましょう。

さて、問題を整理しましょう。

 0 \leqq x \leqq 6のとき、 f(x) = cで、それ以外の範囲であれば、 f(x) = 0の値を取ります。図にすれば、以下のような感じです。 f:id:kurasher:20200603235245p:plain

さきほど、確率密度関数の特性として、

 \displaystyle  \int_{-\infty}^{\infty} f(x) \,\, dx = 1

がありました。これを使うと、

 \displaystyle  \int_{-\infty}^{\infty} f(x) \,\, dx

 \displaystyle  = \int_{0}^{6} f(x) \,\, dx

 \displaystyle  = \int_{0}^{6} c \,\, dx

 \displaystyle  = [ c ]_{0}^{6}

 6c = 1

よって、 \displaystyle c = \frac{1}{6}と求まりました。

ここで、例題に戻ってみましょう。問われているのは、 2 \leqq X \leqq 3の確率です。これを計算すると、

\displaystyle  \int_{2}^{3} f(x) \,\, dx

\displaystyle   = \int_{2}^{3} c \,\, dx

\displaystyle   = \int_{2}^{3} \frac{1}{6} \,\, dx

 \displaystyle = \frac{3}{6} - \frac{2}{6} = \frac{1}{6}

となります。よって、 2 \leqq X \leqq 3の確率 P(2 \leqq X \leqq 3) \displaystyle \frac{1}{6}となります。

まとめ

今回の記事では確率変数などを扱いました。以下、まとめです。

用語 意味
確率変数 ある変数の値を取る確率が存在する変数のこと
確率分布 確率変数の値に対し、その確率変数を取る
確率の分布を表現するもの
離散型確率変数 確率変数の値が飛び飛びのもの
離散型確率分布 確率変数が離散型である場合の確率分布
確率質量関数 離散型確率変数 Xがある値 xの時の確率を
関数 f(x)と表したもの。
また、 \displaystyle \sum_{i = 1}^{n} P(X = x_i) = 1である
連続型確率変数 確率変数の値が途切れないもの
連続型確率分布 確率変数が連続型である場合の確率分布
確率密度関数 連続型確率変数 Xがある値 xを取る確率密度を
関数 f(x)として表したもの。
また、 \displaystyle  \int_{-\infty}^{\infty} f(x) \,\, dx = 1である

このブログの統計学関連の記事を読んでも、さっぱり理解できないという方もいるかと思います。その場合、素直に別の方のブログや参考書を参考にした方がいいです。このブログのみで統計学を理解するなんて無理です。