今回の記事はカイ2乗分布です。ここまで来ると、データサイエンス系の仕事で扱うか研究で扱うか、趣味で扱うかぐらいでしか出てこないように思います...。
カイ二乗分布とは
が互いに独立で標準正規分布に従う確率変数である時、次の式から算出される自由度の (カイ2乗)が従う確率分布のこと。
の時、
< 0
である。
ここで、はガンマ関数のこと(ガンマ関数の説明は省きます)。
カイ二乗分布の性質
ここまで簡単にカイ二乗分布を説明してきましたが、主な使い所としてはカイ二乗分布は母分散の区間推定や適合度の検定、独立性の検定を行う際に使われます。
ここでは以下4つのカイ二乗分布の性質を簡単に紹介していきます(説明というかただの紹介というか...)。
期待値と分散
期待値を、分散をとすると、
となります。
再生性
2つの確率変数、がそれぞれ独立に自由度、のカイ二乗分布、に従うとき、
は自由度のカイ二乗分布に従う。
正規分布に従う母集団からの無作為標本
確率変数がそれぞれ独立に正規分布に従うとき、次の式から算出される値は自由度のカイ二乗分布に従う。
また、この式を展開して得られる次の式の値は自由度のカイ二乗分布に従う。
ここで、は標本平均、は不偏分散です。
カイ二乗分布と指数分布の関係
自由度2のカイ二乗分布はの指数分布と一致する。
母分散の信頼区間の求め方
上記で母分散の区間推定などにカイ二乗分布が使われることを紹介しました。ここでは簡単に母分散の信頼区間を求める過程を簡単にまとめます(95%信頼区間とします)。
1 標本の不偏分散を求める
以下で求めます。
2 使用するカイ二乗分布の自由度を決める
で求められます。
3 上側2.5%点と下側2.5%点を調べる
統計量がカイ二乗分布の95%の面積にあれば良いので、カイ二乗分布表から自由度における上側2.5%点と下側2.5%点を調べる。
4 信頼区間を求める
求めたいのは母分散であるため、母分散について解けば良いことになります。
まとめ
用語 | 意味 |
---|---|
カイ二乗分布 | が互いに独立で標準正規分布に従う確率変数である時、次の式から算出される自由度の (カイ2乗)が従う確率分布 |
確率密度関数 | |
カイ二乗分布の性質1 | 、 |
カイ二乗分布の性質2 | 2つの確率変数、がそれぞれ独立に自由度、のカイ二乗分布、に従うとき、 は自由度のカイ二乗分布に従う。 |
カイ二乗分布の性質3 | 確率変数がそれぞれ独立に正規分布に従うとき、次の式から算出される値は自由度のカイ二乗分布に従う。 |
カイ二乗分布の性質4 | 自由度2のカイ二乗分布はの指数分布と一致する。 |