こうやって統計学の記事を書いていますが、こんだけ続くとはちょっと意外でした。
あ、今回は標本の抽出方法です。
層化抽出法
母集団をあらかじめいくつかの層(グループ)に分け、各層の中から必要な数の調査対象を無作為に抽出する方法。
メリット
- 母集団内情報の比較を行える
- 母集団の推測の精度が増す
- 各層における分布が大きく異なる場合に使える
デメリット
- 母集団内の構成情報を事前に知っておかなければならない
層化抽出法の例
男女比の高校で、10人の学生を抽出するとき、男子は7人、女子は3人の比率で抽出する。
(層の大きさに比例させて調査対象を抽出する方法を、特に比例配分法という。)
クラスター抽出法(集落抽出法)
母集団を小集団に分け、その小集団から無作為にいくつか選び、その小集団から全数調査を行う方法。最後は全数調査を行うところが注意点です。
クラスター抽出法の手順
メリット
- クラスターの情報さえあれば抽出できるため、時間や手間を省ける。
デメリット
- 同じクラスターに属する調査対象は似た性質を持ちやすく、標本に偏りが生じる可能性がある。
クラスター抽出法(集落抽出法)の例
高校生の平均身長を調査する際に、高校を一つのクラスターと考え、高校の中からランダムに10校選び、その高校の学生全員の身長を測定
多段抽出法
母集団をいくつかのグループに分け、そこから無作為抽出でグループを選び、さらにその中から無作為抽出でいくつかのグループを選び、…という操作を繰り返して、最終的に選ばれたグループの中から調査対象を無作為抽出する方法。
メリット
- コストを低く抑えられる
- 抽出効率が高い
デメリット
- サンプルサイズが小さい場合、標本に偏りが生じる可能性がある
多段抽出法の例
- 日本全国から30市区町村を無作為抽出
- 抽出された30市区町村の中からそれぞれ5地区を無作為抽出
- 抽出された5地区の中からそれぞれ20人を無作為抽出
系統抽出法
通し番号をつけた名簿を作成し、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法。
メリット
- 単純無作為抽出寄り時間やコストがかからない
デメリット
- 名簿の並び順に何らかの周期があると、標本に偏りが生じる可能性がある。
系統抽出法の例
1000人から50人選ぶ時、はじめに1000人に通し番号を付け、ランダムに選ばれた番号から3人おきに人を抽出
まとめ
抽出方法のまとめです。実際に現場で抽出とかする場合に、思い出せればいいように思います。
用語 | 意味 |
---|---|
層化抽出法 | 母集団をあらかじめいくつかの層(グループ)に分け、各層の中から必要な数の調査対象を無作為に抽出する方法 |
比例配分法 | 層の大きさに比例させて調査対象を抽出する方法 |
クラスター抽出法(集落抽出法) | 母集団を小集団に分け、その小集団から無作為にいくつか選び、その小集団から全数調査を行う方法 |
多段抽出法 | 母集団をいくつかのグループに分け、そこから無作為抽出でグループを選ぶ操作を何度か繰り返して抽出する方法 |
系統抽出法 | 通し番号をつけた名簿を作成し、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定の間隔で抽出する方法 |