とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.27~標本の抽出法~

こうやって統計学の記事を書いていますが、こんだけ続くとはちょっと意外でした。

あ、今回は標本の抽出方法です。

層化抽出法

母集団をあらかじめいくつかの層(グループ)に分け、各層の中から必要な数の調査対象を無作為に抽出する方法。

メリット

  • 母集団内情報の比較を行える
  • 母集団の推測の精度が増す
  • 各層における分布が大きく異なる場合に使える

デメリット

  • 母集団内の構成情報を事前に知っておかなければならない

層化抽出法の例

男女比 7:3の高校で、10人の学生を抽出するとき、男子は7人、女子は3人の比率で抽出する。
(層の大きさに比例させて調査対象を抽出する方法を、特に比例配分法という。)

クラスター抽出法(集落抽出法)

母集団を小集団に分け、その小集団から無作為にいくつか選び、その小集団から全数調査を行う方法。最後は全数調査を行うところが注意点です。

クラスター抽出法の手順

  1. 母集団を、小集団であるクラスター(集落)に分ける
  2. 分けられたクラスターの中から、いくつかのクラスターを無作為抽出する。
  3. それぞれのクラスターにおいて全数調査を行う。

メリット

  • クラスターの情報さえあれば抽出できるため、時間や手間を省ける。

デメリット

  • 同じクラスターに属する調査対象は似た性質を持ちやすく、標本に偏りが生じる可能性がある。

クラスター抽出法(集落抽出法)の例

高校生の平均身長を調査する際に、高校を一つのクラスターと考え、高校の中からランダムに10校選び、その高校の学生全員の身長を測定

多段抽出法

母集団をいくつかのグループに分け、そこから無作為抽出でグループを選び、さらにその中から無作為抽出でいくつかのグループを選び、…という操作を繰り返して、最終的に選ばれたグループの中から調査対象を無作為抽出する方法。

メリット

  • コストを低く抑えられる
  • 抽出効率が高い

デメリット

  • サンプルサイズが小さい場合、標本に偏りが生じる可能性がある

多段抽出法の例

  1. 日本全国から30市区町村を無作為抽出
  2. 抽出された30市区町村の中からそれぞれ5地区を無作為抽出
  3. 抽出された5地区の中からそれぞれ20人を無作為抽出

系統抽出法

通し番号をつけた名簿を作成し、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法。

メリット

  • 単純無作為抽出寄り時間やコストがかからない

デメリット

  • 名簿の並び順に何らかの周期があると、標本に偏りが生じる可能性がある。

系統抽出法の例

1000人から50人選ぶ時、はじめに1000人に通し番号を付け、ランダムに選ばれた番号から3人おきに人を抽出

まとめ

抽出方法のまとめです。実際に現場で抽出とかする場合に、思い出せればいいように思います。

用語 意味
層化抽出法 母集団をあらかじめいくつかの層(グループ)に分け、各層の中から必要な数の調査対象を無作為に抽出する方法
比例配分法 層の大きさに比例させて調査対象を抽出する方法
クラスター抽出法(集落抽出法) 母集団を小集団に分け、その小集団から無作為にいくつか選び、その小集団から全数調査を行う方法
多段抽出法 母集団をいくつかのグループに分け、そこから無作為抽出でグループを選ぶ操作を何度か繰り返して抽出する方法
系統抽出法 通し番号をつけた名簿を作成し、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法