とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.43〜対応がない場合の2標本t検定〜

今回は対応がない場合の2標本 t検定についてです。

検定の流れ

一旦検定の流れをおさらいしておきましょう。

  1. 仮説を立てる
  2. 有意水準を設定する
  3. 適切な検定統計量を決める
  4. 棄却ルールを決める
  5. 検定統計量をもとに結論を出す

対応のない2標本t検定

例題がある方がわかりやすいので、例題を絡めて解説します。

例題

1組と2組の算数のテストの平均点を比較する。1組30人の平均点は75点、標準偏差は5点、2組32人の平均点は70点、標準偏差は8点だった。
1組と2組の算数のテストの平均点に差はあるか?

解説

検定の流れの順で例題を考えていきましょう。

1 仮説を立てる

今回は「テストの平均点に差はあるか?」という問いなので、帰無仮説 H_0、対立仮説 H_1

 H_0:1組と2組のテストの平均点は等しい
 H_1:1組と2組のテストの平均点には差がある

2 有意水準を設定する

今回の有意水準 \alpha 0.05とします。
 \alpha = 0.05

3 適切な検定統計量を決める

今回は母分散がわかりません。そこで、不偏分散 s ^2を用いる統計量 tを使います。2標本の平均値の差から、前回の式を使います。

4 棄却ルールを決める

この検定で使用する分布は t分布です。そこで、自由度 n

 n = 30 + 32 - 2 = 60

となります。また、1組と2組の算数のテストの平均点に差があるかどうかを調べることが目的なので、両側検定を用います。
統計数値表から
 t_{0.025} (60) = 2.00

です。

5 検定統計量をもとに結論を出す

まずはプールした分散を算出します。

 \displaystyle s ^2 = \frac{(30-1) \times 5 ^2 + (32-1) \times 8 ^2}{30 + 32 -2} = 45.15

これをもとに、統計量 tを計算します。ここで注意点として、1組の母平均を \mu_1、2組の母平均を \mu_2とした時、平均点が等しいという仮定からは \mu_1 - \mu_2 = 0となります。その上で計算すると、

 \displaystyle t = \frac{75-70}{\sqrt{45.15 \times (\frac{1}{30} + \frac{1}{32})}}

 \displaystyle \fallingdotseq 2.93 > t_{0.025} (60) = 2.00

となります。

この P値と有意水準 tの値を図にすると、以下のようになります。拡大した図を使用しているのは、視覚的に理解しやすいためです。

f:id:kurasher:20220326164239p:plain

 P t = 2.93有意水準 \alpha t_{0.025} (60)の値よりも大きいことから、 有意水準を越え、棄却域に入ったことがわかります。
この結果から帰無仮説 H_0は棄却され、対立仮説 H_1が採択されるため「1組と2組の算数のテストの平均点には差がある」と結論づけられます。

コラム:ウェルチのt検定

ここでは詳細な説明はせず、紹介だけにとどめます。 詳細はこちら

対応のない2標本 t検定ですが統計量 tを求める式は、2標本の母分散が等しいという前提のもとに使います。
ただ、最近は等分散かどうかを考慮する必要のないウェルチ t検定を行った方がいいという考え方も一般的になっているようです。

まとめ

対応がない場合の2標本 t検定について見てきました。慣れてしまえば簡単ですが、実際に手計算でやるのは統計検定とか大学の統計関連のテストぐらいですかね?