今回は独立性の検定です。

独立性の検定

2つ以上の分類基準を持つクロス集計表において、分類基準に関連があるかどうかを検定すること。このような場合もカイ二乗分布による検定を行います。

例題

ランダムに得られた男女各100人の血液型について次のようなデータが得られた。この結果から、性別と血液型に関連があるといえるか？

血液型	A型	B型	O型	AB型	計
男性	$55$	$16$	$22$	$7$	$100$
女性	$40$	$24$	$32$	$4$	$100$
合計	$95$	$40$	$54$	$11$	$200$

独立性の検定の手順

独立性の検定ですが、（仮説）検定を行う以上、今まで見てきた下記手順と同じように行います。

仮説を立てる
有意水準を設定
適切な検定統計量を決める
棄却ルールを決める
検定統計量をもとに結論を出す

1 仮説を立てる

$H_0$ ：性別と血液型は独立(関連がない)
$H_1$ ：性別と血液型は独立ではない

2 有意水準を設定

$\alpha = 0.05$

3 適切な検定統計量を決める

独立性の検定ではカイ二乗分布に従うカイ二乗統計量を使います。ですが、適合度の検定でも見たように理論値が必要です。そこでここでは、理論値を算出する必要があります。

ここでは、仮説 $H_0$ より男女の血液型は独立であることから、理論値は男女でそれぞれの血液型が $1:1$ となっていることです。

ここで、 $i$ 列目の度数の合計を $f(i)$ 、 $j$ 行目の度数の合計を $f(j)$ 、全ての度数の合計を $n$ とすると、理論値は以下の式から求められます。

$\displaystyle 理論値 = \frac{f(i) \times f(j)}{n}$

例えば、男性のA型の場合の理論値は

$\displaystyle 理論値 = \frac{95 \times 100}{200} = 47.5$

となります。このようにして全ての理論値を求めると、

血液型	A型	B型	O型	AB型	計
男性	$47.5$	$20$	$27$	$5.5$	$100$
女性	$47.5$	$20$	$27$	$5.5$	$100$
合計	$95$	$40$	$54$	$11$	$200$

となります。

理論値からの実測値のずれを2乗したものを、理論値の値で割り、和をとります。

$\displaystyle \chi ^2 = \sum \frac{(実測値-理論値) ^2}{理論値}$

今回の例では以下のようになります。

$\displaystyle \chi ^2 = \frac{(55-47.5) ^2}{47.5} + \frac{(16-20) ^2}{20}+ \frac{(22-27) ^2}{27}+ \frac{(7-5.5) ^2}{5.5}$

$\displaystyle + \frac{(40-47.5) ^2}{47.5} + \frac{(24-20) ^2}{20}+ \frac{(32-27) ^2}{27}+ \frac{(4-5.5) ^2}{5.5} = 6.639$

4 棄却ルールを決める

$m \times n$ のクロス集計表(縦 $m$ 行、横 $n$ 列)の場合、自由度は $(m-1) \times (n-1)$ のカイ二乗分布を用いて検定を行います。
この場合、

$(2-1) \times (4-1) = 3$

となります。独立性の検定は片側検定で行うため、統計数値表から $\displaystyle \chi_{0.05} ^2(3) = 7.815$ となります。

5 検定統計量をもとに結論を出す

さて、結論を出しましょう。今回で言えば、有意水準は $\chi_{0.05} ^2(3) = 7.185$ 、P値は $6.639$ より、有意水準 $5\%$ において、 $H_1$ を棄却し、帰無仮説を採択します。
つまり、「性別と血液型は独立ではないとは言えない（関連があるとは言えない）」と言えます。

下記のグラフは、カイ二乗分布をわかりやすく大雑把に拡大した図なので、本物のカイ二乗分布のグラフとは違うことに注意してください。

まとめ

用語	意味
独立性の検定	2つ以上の分類基準を持つクロス集計表において、分類基準に関連があるかどうかを検定すること
理論値の求め方	$i$ 列目の度数の合計を $f(i)$ 、 $j$ 行目の度数の合計を $f(j)$ 、全ての度数の合計を $n$ とすると、 $\displaystyle 理論値 = \frac{f(i) \times f(j)}{n}$

とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.48〜独立性の検定〜