とあるお兄さんの雑記

基本的に技術系の内容を書きますが、何を書くかは私の気分です。

統計学

統計学基礎vol.52〜単回帰分析〜

回帰とは 回帰分析と重回帰分析 単回帰式における係数(重み)の求め方 コラム:残差と誤差について まとめ 回帰とは 回帰とは、目的変数について説明変数を使った式で表すこという。 この式のことを回帰方程式、あるいは簡単に回帰式という。また回帰式を求め…

統計学基礎vol.51〜無相関の検定と偏相関係数〜

気づいたら年が明けてました。だから何やねんって話ですが。 無相関の検定 母相関係数の信頼区間 偏相関係数 層別解析 まとめ 無相関の検定 標本から算出した相関係数を使って、母集団の相関係数が0かどうかを検定すること。 帰無仮説: 母相関係数は0(無相…

統計学基礎vol.50〜散布図と相関係数〜

さて、今回からは今までの仮説検定の話を終えて、散布図と相関係数の話に入ります。 長々とやってきた統計学基礎ですが、散布図関連と回帰分析だけを取り上げれば、このブログでの解説は終わろうかと思っています。 まぁ、あと2年ぐらいすれば終わるかもしれ…

統計学基礎vol.49〜母比率の差の検定〜

今のプロジェクトが煌々と燃えていまして。 炎上なんてものじゃないです。個人的には山火事レベル...。 そんなわけでだいぶ仕事したくない欲が非常に強いのです。何かの拍子に会社潰れないかなと思うぐらい。 さてさて、今回は母比率の差の検定です。 母比率…

統計学基礎vol.48〜独立性の検定〜

今回は独立性の検定です。 独立性の検定 例題 独立性の検定の手順 1 仮説を立てる 2 有意水準を設定 3 適切な検定統計量を決める 4 棄却ルールを決める 5 検定統計量をもとに結論を出す まとめ 独立性の検定 2つ以上の分類基準を持つクロス集計表において、…

統計学基礎vol.47〜適合度の検定〜

はてさて、今回は適合度のお話です。 適合度の検定とは 例題 適合度検定の手順 1 仮説を立てる 2 有意水準を設定 3 適切な検定統計量を決める 4 棄却ルールを決める 5 検定統計量をもとに結論を出す まとめ 適合度の検定とは 調査によって得られたクロス集計…

ある病気にかかっているかを検査した時に、1回目、2回目の検査の両方で陽性だった場合

大学院生の頃、とある事情で病院に行き眼圧を測ってもらったのですが、私の場合どうやら普通の人よりも両目の眼圧が高い傾向にあるようで。 その際、眼圧の検査をするだけで3つの検査機器を使って総合的に判断されていたのを覚えています。 で、ここでふと思…

統計学基礎vol.46〜ポアソン分布で考える母比率の検定〜

前回は2項分布を元に母比率の検定を見ていきました。 今回はポアソン分布で考えてみましょう。 例題 解答 1 仮説を立てる 2 有意水準を設定 3 適切な検定統計量を決める 4 棄却ルールを決める 5 検定統計量をもとに結論を出す まとめ 例題 1ヶ月間に平均20件…

統計学基礎vol.44〜対応がある場合の2標本t検定〜

超スローペースでやっている統計学基礎です。いつになったら終わるかもわかっていません。果たして生きているうちに終わるのか...? 今回は対応がある場合の2標本検定についてです。 検定の流れ 対応がある場合の2標本t検定 例題 解説 1 仮説を立てる 2 有意…

統計学基礎vol.43〜対応がない場合の2標本t検定〜

今回は対応がない場合の2標本検定についてです。 検定の流れ 対応のない2標本t検定 例題 解説 1 仮説を立てる 2 有意水準を設定する 3 適切な検定統計量を決める 4 棄却ルールを決める 5 検定統計量をもとに結論を出す コラム:ウェルチのt検定 まとめ 検定…

統計学基礎vol.42〜t検定〜

明けましておめでとうございます。 こちらのブログも月1回のペースであげれば十分じゃね?というより頑張っている方じゃね?と最近思うようになってきた私です。 私の中では仕事が忙しいからブログを更新・投稿する頻度が少ないと目を背けているわけですが、…

統計学基礎vol.41~検定~

今回は検定のお話です。検定というと両側検定と片側検定がありますが、基本は両側検定しか見ないかと思います。 両側検定 片側検定 両側検定と片側検定の違い 検定を行う際の注意点 まとめ 両側検定 帰無仮説が、対立仮説がである時に行う検定のこと。 片側…

統計学基礎vol.40~第一種の過誤と第二種の過誤~

いや〜、寒い季節になりましたね。 特に今年に限っては夏があった後、秋を経過せずに冬に移行した気がします。将棋で言えば序盤からいきなり終盤戦に移行した感じです。 一体今年の秋はどこへ行ったのか、謎です。 あ、今回は第一種の過誤と第二種の過誤です…

統計学基礎vol.39~統計的仮説検定の基礎用語~

今回から統計的仮設検定のお話です。個人的にはこれがやりたくてここまで記事書いてきたって言っても過言ではないです。 理解しているかどうかは別として。 統計的仮説検定 検定を行う上での注意点 導かれた結論が「絶対に正しい」と考えることはできない 基…

統計学基礎vol.38~カイ2乗分布~

今回の記事はカイ2乗分布です。ここまで来ると、データサイエンス系の仕事で扱うか研究で扱うか、趣味で扱うかぐらいでしか出てこないように思います...。 カイ二乗分布とは カイ二乗分布の性質 期待値と分散 再生性 正規分布に従う母集団からの無作為標本 …

統計学基礎vol.37~母比率の差の信頼区間~

今回は母比率の差の信頼区間です。とはいえ、理論だけでは難しいので例題を上げながら考えていきましょう。 例題 例題 ある野菜ジュースのアンケート調査を行うと、女性では200人中80人が、男性では300人中60人が買ってみたいと答えた。 この結果からこの野…

統計学基礎vol.36 part2~母比率を扱った問題~

前回、母比率の信頼区間を簡単に説明しましたが、そこそこ難しいので練習問題を3題ほど載せて解説します。(いずれも統計Webさんからですが) ちなみに、投稿頻度が少なくなっているのはたまたまです。 問題1〜信頼区間の幅を求める場合 解説1 問題2〜サンプ…

統計学基礎vol.36~母比率の信頼区間~

今回の記事は母比率の信頼区間についてです。正直よく分かっていないので、この記事を読む方は要注意です。 ちなみに、最近の楽しみは毎週土曜の19時から放送される第4回Abemaトーナメントを見ることです。 母比率とは 母比率の信頼区間の求め方 まとめ 母比…

統計学基礎vol.35~母平均の差の信頼区間~

今回は母平均の差の求め方について書いていきます。 私が統計検定2級取得に勤しんでいた頃、この章をみた時、「さすがにこんな難しい問題、統計検定では出ないだろ」と思って、過去問を漁ったところ普通に出てきてました。 そして、泣く泣く勉強したことをい…

統計学基礎vol.34〜母平均の信頼区間を求める(母分散が未知の場合)〜

前回の記事は、母分散が既知の場合の母平均の信頼区間を求めました。今回の記事は母分散が未知の場合の信頼区間を求めてみます。 しかし、実際の現場とかで、母平均を求めることってあるんでしょうか?母平均の信頼区間を求めるなんて、学生の統計学の試験か…

統計学基礎vol.33〜母平均の信頼区間を求める(母分散が既知の場合)〜

今回の記事は母分散が既知の場合の、母平均の信頼区間の値を求めてみます。 正直な話、母平均が未知なのに、どうして母分散が分かるんだって気がしますが...。そういう特殊ケースがあるんでしょう、世の中には。 母平均の信頼区間~母分散が既知の場合~ 1. …

統計学基礎vol.32~区間推定~

こんにちは 最近は、TwitterでGAFA(米国の主要IT企業であるグーグル(Google)、アマゾン(Amazon)、フェイスブック(Facebook)、アップル(Apple)の4社の総称)社員を名乗る方のつぶやきをみて鼻で笑っています、Windowsのショートカットキーを勉強してい…

あなたの身長は上位何%?(男性版のみ)

最近暇を持て余しておりまして。(嘘です。任された仕事がいつまで経っても終わらず、先輩方に迷惑ばかりかけてないか不安です。) そんなおり、友人にけしかけられたということもあり、マッチングアプリなるものをはじめてみました。 いろいろな女性がいら…

統計学基礎vol.31~標本分散と不偏分散~

今回は標本分散と不偏分散です。 やはりエンジニア(といいつつ、最近はプログラムを書くことが多いのでプログラマーなのか?)の端くれなので、テック系の記事が受けますかね...? 標本分散 コラム:一致推定量/不偏推定量とは 不偏分散 標準偏差 標準誤差 …

統計学基礎vol.30~推定と検定~

統計学の推定と検定です。 おおよその内容は統計Webさんの内容をかなり薄くしたものなので、しっかり学びたい方は統計Webさんの方でしっかり学びましょう! bellcurve.jp 推定と検定 点推定 区間推定 推定量 推定値 一致性 不偏性 コラム:標本平均の性質 ま…

統計学基礎vol.29~中心極限定理~

今回の記事は中心極限定理です。 前回と今回と統計学的な内容が入ってきてテンション上がりますね! 中心極限定理 中心極限定理を確かめる 条件・環境など プログラムコード 出力〜サンプルサイズを変えながら サンプルサイズn = 50の時 サンプルサイズ n = …

統計学基礎vol.28~大数の法則~

最近、なんで人って写真なんか撮るんだろうか、インスタ目当てか?なんて考えていたんですが。 聞いた話であれば人って楽しい出来事よりも悲しい出来事の方が記憶に残りやすいそうで。 ということを考えると、楽しい思い出を残しておくのは自然だなぁと思う…

統計学番外編~研究デザイン~

この記事で紹介する内容は、常識的な生活を送っている限りは基本的にあまり出てきません。そのため、そこまで詳しい説明を行いません。 実験研究 ランダム化比較実験(前向き研究) クロスオーバー試験(前向き研究) 観察研究 横断研究 コホート研究(前向…

統計学基礎vol.27~標本の抽出法~

こうやって統計学の記事を書いていますが、こんだけ続くとはちょっと意外でした。 あ、今回は標本の抽出方法です。 層化抽出法 メリット デメリット 層化抽出法の例 クラスター抽出法(集落抽出法) クラスター抽出法の手順 メリット デメリット クラスター…

統計学基礎vol.26~全数調査と標本調査~

「統計学ばっか上げてんじゃねーよ(# ゚Д゚)」 私のブログを見ていただいている友人からのコメントで、彼としては技術的なことや、作ってみたとかのプロトタイプを取り扱ってほしいんだそうです。 確かに最近統計学が多いな~とは思ってはいました。まぁ、そん…