良いサブタイトルが分からず、こんな分かりにくいサブタイトルになりました。お許しください....。
確率変数
ある変数の値を取る確率が存在する変数のこと。
サイコロを例にとります。サイコロの出る目をとします。
この時、はです。これを確率で表すと
であり、この時のを確率変数と言います。
確率分布
確率変数の値に対して、その確率変数を取る確率の分布を表現するもの。
サイコロを例にした場合、以下のような表になります。
サイコロの目 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|
確率 |
サイコロの場合、各目(確率変数)に対して確率が対応しているため、サイコロは確率分布と言えます。
ちなみに、どの目に対しても一様な確率であることから、サイコロの目は一様分布であるともいえます。
離散型と連続型
次に、確率変数が離散型か連続型かで説明を行います。その前に、そもそも離散型と連続型の違いは何なのか、簡単にイメージを持ってもらいます。
離散型の確率変数というのはいわゆる、確率変数の値が飛び飛びのものです。代表的な例で言えば、サイコロの目、コインの表、裏などがあります。反対に、連続型の確率変数はというと、確率変数の値が途切れなく続くものです。代表的な例としては、体重や、身長などがあります。
ここで、確率変数という言葉を除いた、離散型と連続型について考えてみましょう。離散型というのは、値が飛び飛びのものです。最たる例で言えば、デジタル時計がそれにあたります。
デジタル時計は、多くの場合100分の1秒までを表示します。さらに細かい、1,000分の1秒や、10,000分の1秒を表示することはできません。つまり、100分の1秒ごとに値が途切れているわけです。
一方、連続型というのは、値が途切れなく続いています。これはアナログ時計にあたります。アナログ時計の場合、秒針がついています。その秒針は、我々が認識することはほぼ不可能なぐらい一瞬ですが、1,000分の1秒や、10,000分の1秒を表示しています。このように、値が途切れなく続いているものが連続にあたります。
理解が難しい場合、以下のような認識を持ってもらえれば大丈夫です(多少無理やり感がありますが)。
ある点からある点に向けて線を引くとき、線が途切れれば離散、線が途切れなければ連続である。
離散型
まずは確率変数が離散型から。
離散型確率変数
飛び飛びの値を取る変数のことで、隣り合う数字の間には値が存在しない。
離散型確率分布
確率変数が離散型である場合の確率分布
例. 2項分布、幾何分布、ポアソン分布など
確率質量関数
離散型確率変数がある値の時の確率を関数と表したもの。
また、
である(確率変数Xの要素の全ての確率を足せば1()になるよね、という話です)。
例示
サイコロで例を示しましょう。 で、(3の目が出る事象)を表す場合、
となります。また、の添え字のがサイコロの目と対応しているとすれば、
連続型
次に確率変数が連続型の場合です。
連続型確率変数
重さや温度などのように連続した値を取るもの。値同士の間に途切れが無いモノという認識で大丈夫です。
連続型確率分布
確率変数が連続型である場合の確率分布。
例. 一様分布、指数分布、正規分布など
確率密度関数
連続型確率変数がある値を取る確率密度を関数として表したもの。
また、ある確率密度関数において、となる確率は、
と計算できる。また、
である(離散型の確率質量関数で見たのと一緒で、端から端まで足せば確率の値は1になるよね、という話です)。
※連続型確率変数の場合、確率密度を計算するため、場合によってはとなることもあります。
上の式で積分の計算をしている、ということは、面積を計算していると言えます。
つまり、連続型確率変数の確率は面積で表されるのです。ちょうど下の色のついた部分がの確率にあたります。
普段「面積を確率とみなす」ことに馴染みが無いので、あまりピンとこないと思いますが。
例示
連続型の例示として(正しいかどうかは分かりませんが)、洗濯機が壊れる日というのを考えてみます。洗濯機が壊れる時間というのは、例えば10年と33日の4時間23分55.90324....秒のように連続です。そのため、洗濯機が壊れる時間を連続型確率変数と考えることが出来ます。
この時、洗濯機を買ってから3年目~6年目の間に壊れる確率は
で表されます。
また、洗濯機は時間を無限大にすればいずれ壊れますので(負の時間は考えないものとする)、
となりますね。
例題. 確率密度関数からある範囲の確率をもとめてみよう
と定義する(は定数)。このとき、の確率を求めよ。
解
上の例題を難しくしたものは、統計検定2級に普通にでてきます。統計検定2級を目指す人は気を付けましょう。
さて、問題を整理しましょう。
のとき、で、それ以外の範囲であれば、の値を取ります。図にすれば、以下のような感じです。
さきほど、確率密度関数の特性として、
がありました。これを使うと、
よって、と求まりました。
ここで、例題に戻ってみましょう。問われているのは、の確率です。これを計算すると、
となります。よって、の確率はとなります。
まとめ
今回の記事では確率変数などを扱いました。以下、まとめです。
用語 | 意味 |
---|---|
確率変数 | ある変数の値を取る確率が存在する変数のこと |
確率分布 | 確率変数の値に対し、その確率変数を取る 確率の分布を表現するもの |
離散型確率変数 | 確率変数の値が飛び飛びのもの |
離散型確率分布 | 確率変数が離散型である場合の確率分布 |
確率質量関数 | 離散型確率変数がある値の時の確率を 関数と表したもの。 また、である |
連続型確率変数 | 確率変数の値が途切れないもの |
連続型確率分布 | 確率変数が連続型である場合の確率分布 |
確率密度関数 | 連続型確率変数がある値を取る確率密度を 関数として表したもの。 また、である |
このブログの統計学関連の記事を読んでも、さっぱり理解できないという方もいるかと思います。その場合、素直に別の方のブログや参考書を参考にした方がいいです。このブログのみで統計学を理解するなんて無理です。