今回は統計学というより、統計学の用語をまとめた感じになります。しばらくこんなブログが続きますが、そこらへんはご容赦ください。
母集団
本来知りたいと思っている集団全体のこと。
日本全国民を対象にしたものであれば、国勢調査があります。
標本
母集団の情報を推測するために選ばれた一部の集団。
日本全国民を対象にするのであれば、理想は日本全国民に聞くべきです。しかし、時間やコストなどを考えると、これは現実的ではありません。
そこで、母集団の中から一部分を調査し、その調査結果から母集団全体を推測できないか?という考えが生まれます。
この、
母集団の中から一部分を抽出した集団
のことを標本と言います。
標本 母集団
という感じですね。
抽出
母集団から一部を選んで標本とすること。
ここまでの用語をまとめると、
母集団から抽出を経て、標本が出来上がる、という感じですね。
推測統計学
母集団の性質を推測すること。
推測統計学の名にある通り、推測します。で、何を推測するかというと、母集団の性質です。何から推測するかというと、手元にあるデータからです。
記述統計学
取得した手元のデータを用いて、データの特徴をグラフや表などを用いて分かりやすく表現すること。
記述統計学とあるように、データを記述します。
ここまでの用語の関係性は統計Webの解説が分かりやすいです。
統計Web: 母集団と標本
コラム:有限母集団と無限母集団
有限母集団とは有限の要素からなる母集団で、無限母集団は無限の要素からなる母集団のことを指します。
例えば、日本国民全体は有限母集団です。どんなに数が多くてもしっかり数えていけば、必ず有限で終わります。
もうちょっと小さい数で、有限母集団を考えると、日本国籍を保有するプロサッカー選手などがそれにあたります。
一方、無限母集団ですが、例えば、50メートルを平均何秒で走れるかを計測することを考えましょう。
この場合、1回だけでは心もとないので何度も走ることになります。加えて、追い風だったり、向かい風だったりでデータにもばらつきが出ます。
ということを考えると、無限回走れば正確なデータが得られます。
まぁ、走れるわけないんですが…。
まとめ
用語 | 意味 |
---|---|
母集団 | 本来知りたいと思っている集団全体のこと |
標本 | 母集団の情報を推測するために選ばれた一部の集団 |
抽出 | 母集団から一部を選んで標本とすること |
推測統計学 | 母集団の性質を推測すること。 |
記述統計学 | 取得した手元のデータを用いて、データの特徴をグラフや表などを用いて分かりやすく表現すること |
有限母集団 | 有限の要素からなる母集団 |
無限母集団 | 無限の要素からなる母集団 |