とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.26~全数調査と標本調査~

統計学ばっか上げてんじゃねーよ(# ゚Д゚)」


私のブログを見ていただいている友人からのコメントで、彼としては技術的なことや、作ってみたとかのプロトタイプを取り扱ってほしいんだそうです。

確かに最近統計学が多いな~とは思ってはいました。まぁ、そんなん無視して今回も統計記事ですが...。

気が向いたら統計学以外の何かを上げようと思います。気が向いたらね。

全数調査

調査対象となる母集団をすべて調べること。

例としては、国勢調査が挙げられます。

母集団すべてを調査するわけですからかなり時間がかかります。となると、調査対象から一部だけ取り出して調べる方法が考えられます。

標本調査

調査対象となる母集団の一部を取り出して調べること。

工場での抜き取り調査などが標本調査にあたります。例えば、1万個作成したうち100個を調査し、平均をとるなどして予め決められた基準を満たすかどうかを調べ、


100個中99個が基準を満たすなら、作成された1万個のうち99%が基準を満たす


なんてことが言えるわけです。

抽出のいろいろ

一言に標本抽出と言っても、いろいろな抽出方法があります。順に紹介します。

単純無作為抽出法

母集団から「完全に」「ランダムに」標本を抽出すること。
この抽出では、母集団の中の要素が標本として選ばれる確率は各々等しいという前提条件があり、乱数などで標本を抽出する方法がある。

例えば、ある要素だけものすごく出にくいみたいな前提は仮定していないということです。

復元抽出法

一度抽出された標本を母集団に戻す抽出方法。
調査対象が重複されて標本に含まれる可能性があります。袋の中に赤いボールと白いボールを入れて、1個ボールを取り出して戻すみたいな問題に近いですね。

非復元抽出法

一度抽出された標本は、母集団の中に戻さない抽出方法。
一度抽出された調査対象は、重複して標本に含まれることはありません。これも先に上げた例のように、今度はボールを戻さない問題に近いですね。

コラム:標本の大きさと標本数

標本の大きさと標本数って同じじゃないの?と思うかもしれませんが、違います。
例で理解してみましょう。

日本人から100人を抽出し、アンケートを行う調査を5回繰り返す。
この時、100人が標本の大きさ、サンプルサイズ、5回が標本数、サンプル数と言われます。

ここで、サンプルが「標本」、「群」という意味を持つことを考えれば、

サンプルは、ひとまとまりの観測データ

といえます。つまり、サンプル数はひとまとまりの観測データの数と言えます。


一方、標本の大きさ、サンプルサイズは、1サンプル自体の大きさを表すことになります。
図にすれば以下のようになります。

f:id:kurasher:20201102005319p:plain

まとめ

用語 意味
全数調査 調査対象となる母集団をすべて調べること
標本調査 調査体調となる母集団の一部を取り出して調べること
単純無作為抽出法 母集団から完全に、ランダムに標本を抽出すること
復元抽出法 一度抽出された標本を母集団に戻す抽出方法
非復元抽出法 一度抽出された標本は、母集団の中に戻さない抽出方法
サンプルサイズ 1サンプル自体の大きさ
サンプル数 ひとまとまりの観測データ(サンプル)の数

おそらく、次も統計学の記事ですかね...。