とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.25~母集団と標本~

今回は統計学というより、統計学の用語をまとめた感じになります。しばらくこんなブログが続きますが、そこらへんはご容赦ください。

母集団

本来知りたいと思っている集団全体のこと。

日本全国民を対象にしたものであれば、国勢調査があります。

標本

母集団の情報を推測するために選ばれた一部の集団。

日本全国民を対象にするのであれば、理想は日本全国民に聞くべきです。しかし、時間やコストなどを考えると、これは現実的ではありません。

そこで、母集団の中から一部分を調査し、その調査結果から母集団全体を推測できないか?という考えが生まれます。

この、
母集団の中から一部分を抽出した集団

のことを標本と言います。

標本  \subset 母集団

という感じですね。

抽出

母集団から一部を選んで標本とすること。

ここまでの用語をまとめると、

母集団から抽出を経て、標本が出来上がる、という感じですね。

推測統計学

母集団の性質を推測すること。

推測統計学の名にある通り、推測します。で、何を推測するかというと、母集団の性質です。何から推測するかというと、手元にあるデータからです。

記述統計学

取得した手元のデータを用いて、データの特徴をグラフや表などを用いて分かりやすく表現すること。

記述統計学とあるように、データを記述します。

ここまでの用語の関係性は統計Webの解説が分かりやすいです。
統計Web: 母集団と標本

コラム:有限母集団と無限母集団

有限母集団とは有限の要素からなる母集団で、無限母集団は無限の要素からなる母集団のことを指します。

例えば、日本国民全体は有限母集団です。どんなに数が多くてもしっかり数えていけば、必ず有限で終わります。
もうちょっと小さい数で、有限母集団を考えると、日本国籍保有するプロサッカー選手などがそれにあたります。

一方、無限母集団ですが、例えば、50メートルを平均何秒で走れるかを計測することを考えましょう。
この場合、1回だけでは心もとないので何度も走ることになります。加えて、追い風だったり、向かい風だったりでデータにもばらつきが出ます。
ということを考えると、無限回走れば正確なデータが得られます。
まぁ、走れるわけないんですが…。

まとめ

用語 意味
母集団 本来知りたいと思っている集団全体のこと
標本 母集団の情報を推測するために選ばれた一部の集団
抽出 母集団から一部を選んで標本とすること
推測統計学 母集団の性質を推測すること。
記述統計学 取得した手元のデータを用いて、データの特徴をグラフや表などを用いて分かりやすく表現すること
有限母集団 有限の要素からなる母集団
無限母集団 無限の要素からなる母集団