この記事では目にすることは少ないものの、知っておいた方が良いと思われる用語集をまとめたものです。
幾何平均
割合や比率で変化するものに対して使う。
過去3年間で家賃が、、上昇したとき、
、つまり1年で平均上昇したことになります。
調和平均
時速の平均などに利用。
行き時速、帰りでドライブしたときの平均時速は
刈り込み平均
データを小さい順(昇順)に並べたとき、小さい側と大きい側からそれぞれ指定した個数を除き、残ったデータのみから求める平均
...…何に使うんでしょう?私は分からないです……。
幹葉図
度数分布のグラフ表現の一つ。階級値が幹で、階級の次の位の数が葉で表されます。ヒストグラムでは実際の値までは分からないのですが、幹葉図ではそれが分かります。また、第一四分位数、中央値、第三四分位数を求めることもできます。
例. の場合
度数 | 幹 | 葉 |
---|---|---|
1 | 2 | 7 |
4 | 3 | 0 3 3 7 |
2 | 4 | 1 5 |
歪度(わいど)(統計Web版)
分布が正規分布からどれだけ歪んでいるのかを表す統計量で、左右対称性を示す指標
各データの平均値を、サンプルサイズを、標準偏差をとすると、
と表せる。
右に裾が長い場合
上記の図のような分布を右に裾が長い分布という。また、右に歪んだ分布、左に偏った分布ともいう。
右に裾が長い分布の場合、歪度は
となる。
左に裾が長い場合
上記の図のような分布を左に裾が長い分布という。また、左に歪んだ分布、右に偏った分布ともいう。
左に裾が長い分布の場合、歪度は
となる。
ちなみに、となるのは左右対称の時だけ。
尖度(せんど)(統計Web版)
分布が正規分布からどれだけとがっているかを表す統計量で、山の尖り度と裾の広がり度を示す指標
各データの平均値を、サンプルサイズを、標準偏差をとすると、
と表される。
正規分布よりとがった分布の時
上記の図で、黒の実線が標準正規分布、赤い実線が標準正規分布よりとがった分布を表しています。
正規分布よりとがった分布(データが平均付近に集中し、分布の裾が思い)時には尖度は正の値を取る。
正規分布より扁平な分布
上記の図で、黒の実線が標準正規分布、赤い実線が標準正規分布より扁平な分布を表しています。
正規分布より扁平な分布(データが平均付近から散らばり、分布の裾が軽い)時には尖度は負の値を取る。
歪度(高校数学の美しい物語)
確率変数が従う分布の歪度は以下のように定義される。
歪度は平均から遠いところが平均に寄与する(外れ値が影響) 。この考えは重要で、以下に説明するように理解の手助けになるかと思います。
右に裾が長い場合
歪度は平均から遠いところが平均に寄与するため、
左側にコブ
右側に大きく離れたデータがある
より、となる。
左に裾が長い場合
歪度は平均から遠いところが平均に寄与するため、
右側にコブ
左側に大きく離れたデータがある
より、となる。
尖度(高校数学の美しい物語)
確率変数が従う分布の尖度は以下のように定義される。
歪度・尖度の特徴
歪度、尖度はで正規化しているため、定数倍や平行移動で値は変わらない
つまり、が従う分布の歪度、尖度はが従う分布の歪度、尖度と等しい(は不変)
平行移動の場合
、の値は不変
定数倍
に対してを考えると、
、
となる。