とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学基礎vol.39~統計的仮説検定の基礎用語~

今回から統計的仮設検定のお話です。個人的にはこれがやりたくてここまで記事書いてきたって言っても過言ではないです。

理解しているかどうかは別として。

統計的仮説検定

確率をもとに結論を導く方法。

検定の手順としては、

  1. 仮説を立てる
  2. 起こった結果を確率的に検証
  3. 結論を導く

となります。

検定を行う上での注意点

導かれた結論が「絶対に正しい」と考えることはできない

砕けた小さな隕石が地球に落ちてきて、それが誰かに当たる確率というのが新聞などで目にすることはあるかと思います。この確率ですが、誰かに当たる確率は低くても0%になっていることはないと思います。
そのため、「滅多に起こらない」という結論が出せたとしても、その事象が起きる時は起きてしまいます。検定は確率をもとに判断を行うので、結論が絶対に正しいと考えることは残念ながらできません。

基準は先に決めておく

ある事象において「〇〇%未満ならこの事象は滅多に起きにくい」という基準は先に決めておく必要があります。
仮に基準を決めないで実験や試行を行い、結果、7%の確率でその事象が起こるとわかったとします。
基準を5%とすれば、実際の結果は7%なのでこの事象が滅多に起こらないとは言えません。一方で、基準を10%とすれば、実際の結果は7%なのでこの事象は滅多に起こらないと言えてしまいます。

f:id:kurasher:20211024010731p:plain

以上のように、基準を決めておかないと後出しジャンケンのように結論を言い換えることができます。

帰無仮説

検定を行うために立てる仮説のこと。この仮説を元に検定を行い結論を導く。
ちなみに、帰無仮説 H_0と書きます。 H Hypothesisの略です。

対立仮説

帰無仮説に対する仮説のこと。本来証明したい仮説のことです。ちなみに、対立仮説を H_1と書きます。

検定統計量

帰無仮説が正しいと仮定したとき、観測した事象よりも稀なことが起こる確率を計算するための値。

P値

帰無仮説が正しいと仮定した時に、観測した事象よりも極端なことが起こる確率のこと。

例えば、10回コインを投げた時に、2回だけ表が出た場合、
P値は「0回表が出現、1回表が出現する確率を足したもの」を表します。

 P値は「観測した事象よりも極端な事象が起こる確率」であるため、上記のように確率を足し合わせます。
そのため、 P値は累積確率となります。

有意水準(危険率)

帰無仮説を棄却するための基準となる確率。検定を行う前に決めておく必要がある。

棄却

仮説を捨てること。
P値の面積(確率)が有意水準の面積(確率)よりも大きい場合、帰無仮説は棄却されず、帰無仮説が正しいとも言えない。
P値の面積(確率)が有意水準の面積(確率)よりも小さい場合、帰無仮説を棄却し、対立仮説を採択。

下の図を見りゃおおよそ理解できるかと思います。ただし、常に右から計算するわけではないので、そこら辺は臨機応変に計算してください。
ちなみに、統計検定2級でこの手の問題を解く場合、有意水準 P値は小さい値がほとんどなので、下の図のように無駄に大きなグラフを書いてどこに有意水準 P値があるかを図示すると非常に解きやすくなります。

f:id:kurasher:20211024025419p:plain

P値と有意水準

 P値が有意水準を下回った場合、その P値は偶然とる値ではないと結論づけられます。
つまり、以下のように考えることが可能です。

 P値が有意水準を下回った

その P値は偶然取る値ではないと言える

つまり、有意水準よりも極めて珍しいことが起こった

つまり、この事象が起こったということは何かしら意味が有る(有意である)と言える。

ここでの意味というのは、何かしらの細工(イカサマのコインを使うなど)だったり、第三者からの何かしらの意図だったり、社会的背景や環境などが起因していることが挙げられます。
が、とにかく、偶然ではない何か(意図や意味)が働いているということがわかります。

検出力

有意水準と対するもので、帰無仮説が正しくない時に、正しく帰無仮説を棄却する確率のこと。

まとめ

用語 意味
統計的仮説検定 確率をもとに結論を導く方法
帰無仮説 検定を行うために立てる仮説のこと
対立仮説 帰無仮説に対する仮説のことで、本来証明したい仮説のこと
検定統計量 帰無仮説が正しいと仮定したとき、観測した事象よりも稀なことが起こる確率を計算するための値
有意水準(危険率) 帰無仮説を棄却するための基準となる確率
棄却 仮説を捨てること
検出力 有意水準と対するもので、帰無仮説が正しくない時に、正しく帰無仮説を棄却する確率のこと