とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.48〜独立性の検定〜

今回は独立性の検定です。

独立性の検定

2つ以上の分類基準を持つクロス集計表において、分類基準に関連があるかどうかを検定すること。このような場合もカイ二乗分布による検定を行います。

例題

ランダムに得られた男女各100人の血液型について次のようなデータが得られた。この結果から、性別と血液型に関連があるといえるか?

血液型 A型 B型 O型 AB型
男性  55  16  22  7  100
女性  40  24  32  4  100
合計  95  40  54  11  200

独立性の検定の手順

独立性の検定ですが、(仮説)検定を行う以上、今まで見てきた下記手順と同じように行います。

  1. 仮説を立てる
  2. 有意水準を設定
  3. 適切な検定統計量を決める
  4. 棄却ルールを決める
  5. 検定統計量をもとに結論を出す

1 仮説を立てる

 H_0:性別と血液型は独立(関連がない)
 H_1:性別と血液型は独立ではない

2 有意水準を設定

 \alpha = 0.05

3 適切な検定統計量を決める

独立性の検定ではカイ二乗分布に従うカイ二乗統計量を使います。ですが、適合度の検定でも見たように理論値が必要です。そこでここでは、理論値を算出する必要があります。

ここでは、仮説 H_0より男女の血液型は独立であることから、理論値は男女でそれぞれの血液型が 1:1となっていることです。

ここで、 i 列目の度数の合計を  f(i) j行目の度数の合計を f(j)、全ての度数の合計を nとすると、理論値は以下の式から求められます。

 \displaystyle 理論値 = \frac{f(i) \times f(j)}{n}

例えば、男性のA型の場合の理論値は

 \displaystyle 理論値 =  \frac{95 \times 100}{200} = 47.5

となります。このようにして全ての理論値を求めると、

血液型 A型 B型 O型 AB型
男性  47.5  20  27  5.5  100
女性  47.5  20  27  5.5  100
合計  95  40  54  11  200

となります。



理論値からの実測値のずれを2乗したものを、理論値の値で割り、和をとります。

 \displaystyle \chi ^2 = \sum \frac{(実測値-理論値) ^2}{理論値}

今回の例では以下のようになります。

 \displaystyle \chi ^2 = \frac{(55-47.5) ^2}{47.5} + \frac{(16-20) ^2}{20}+ \frac{(22-27) ^2}{27}+ \frac{(7-5.5) ^2}{5.5}

 \displaystyle + \frac{(40-47.5) ^2}{47.5} + \frac{(24-20) ^2}{20}+ \frac{(32-27) ^2}{27}+ \frac{(4-5.5) ^2}{5.5} = 6.639

4 棄却ルールを決める

 m \times nのクロス集計表(縦 m行、横 n列)の場合、自由度は (m-1) \times (n-1)カイ二乗分布を用いて検定を行います。
この場合、

 (2-1) \times (4-1) = 3

となります。独立性の検定は片側検定で行うため、統計数値表から \displaystyle \chi_{0.05} ^2(3) = 7.815となります。

5 検定統計量をもとに結論を出す

さて、結論を出しましょう。今回で言えば、有意水準  \chi_{0.05} ^2(3) = 7.185、P値は 6.639より、有意水準 5\%において、 H_1を棄却し、帰無仮説を採択します。
つまり、「性別と血液型は独立ではないとは言えない(関連があるとは言えない)」と言えます。

下記のグラフは、カイ二乗分布をわかりやすく大雑把に拡大した図なので、本物のカイ二乗分布のグラフとは違うことに注意してください。

まとめ

用語 意味
独立性の検定 2つ以上の分類基準を持つクロス集計表において、分類基準に関連があるかどうかを検定すること
理論値の求め方  i 列目の度数の合計を  f(i) j行目の度数の合計を f(j)、全ての度数の合計を nとすると、 \displaystyle 理論値 = \frac{f(i) \times f(j)}{n}