今回は標本分散と不偏分散です。
やはりエンジニア(といいつつ、最近はプログラムを書くことが多いのでプログラマーなのか?)の端くれなので、テック系の記事が受けますかね...?
標本分散
得られたデータの平均を、個々のデータを、サンプルサイズをとすると、標本分散は
と表される。
ただし、標本分散は一致推定量ではあるものの、不偏推定量ではない。
コラム:一致推定量/不偏推定量とは
前回の記事で若干触れたといえば触れたのですが。
一言でいえば、サンプル数を増やしまくれば、ほぼ真の値を予測できるというものです。
反対に不偏推定量は、サンプルの数は一切関係なく、予測値の平均値は、真の値に一致するというものです。
不偏分散
標本分散の代わりに、標本分散の期待値が母分散に一致するようにをかけたもの。不偏分散は一致性と普遍性を持つ推定量である。
ちなみに、標本分散と不偏分散の使い分けとしては、母集団すべてのデータを使って求めたものが標本分散となります。
一方、不偏分散は母集団のデータから無作為に取り出したデータから求めたものになります。
標準偏差
不偏分散の平方根のうち、正の数値
標準誤差
とも書きます。
推定量の標準偏差で、標本から得られる推定量そのもののばらつき(精度)を表すもの。
一般的に標本平均の標準偏差を意味する。
まとめ
用語 | 意味 |
---|---|
標本分散 | |
不偏分散 | |
標準偏差 | |
標準偏差 |