高卒フリーターがAIエンジニアを目指す

機械学習・Python・数学 の勉強メモ

【確率統計】推定・検定入門/全9講

ヨビノリさんの確率統計の再生リスト
www.youtube.com
これからの講義で対象になるのは「推測統計」

①母集団と標本

https://youtu.be/Bj8fkq533Dc

コンドル(ファボ0のレポ)

コンドルは死肉を食べる(ハゲワシも一緒)。頭に毛がない理由は、毛に死肉の細菌がつかないようにするため。また、殺菌のために日光浴もする。

母集団

調査の対象となる全データのこと。

3つの統計解析

統計解析は大きく分けて記述統計と推測統計の2つに分けられる。ベイズ統計はおまけで足した

  • 記述統計

演繹的な算法。母集団が判明しており、その母集団の特徴を求めるもの。例えば、あるクラス40人の身長の平均値を算出するなど。(クラス40人全ての身長が判明している)

  • 推測統計

帰納的に推測する統計。母集団のうちからいくつかの標本を取り、その標本から母集団の特徴を推測するもの。例えば、世界中の人間の身長の平均値を算出するなど。

上の2つとはちょっと毛色が違う(というか並列関係にない)
ベイズの定理を用いた統計学。詳しくは↓
noromap.hatenablog.com

推測統計(より詳細に)
  • 観察集団(標本)のデータから母集団の特性を「推定」する
    • 平均/分散/係数値などの推定(点推定)
    • 点推定値のばらつきを調べる(区間推定)
  • 検定統計量を用いた「検定」

推測統計では、母集団は大きくないとダメ。
入っている個数の少ないボックスガチャを考えてほしい。1個ガチャを引く(標本を抽出する)と、残りのガチャ全体(母集団)の特徴が変わってしまう。

記号の定義

母平均:μ \\
母分散:σ^2 \\
標本:X_1,X_2 ... X_n

大文字と小文字で表すものの違い
大文字…確率変数
小文字…具体的な数(実現値、観測値)
標本って具体的な数値じゃないの?と思うかもしれないし、実際そうだけど、
標本は抽出するたびに変わるから確率”変数”
標本を10個とってきてまた母集団に戻し、次にまた標本10個とってきたとき、
最初の10個と次の10個では値が全然異なっている。

②点推定

ツキノワグマ(ファボ0のレポ)

猛獣扱いされるツキノワグマ、実は主食は山菜。