【確率統計】推定・検定入門/全9講
ヨビノリさんの確率統計の再生リスト
www.youtube.com
これからの講義で対象になるのは「推測統計」
①母集団と標本
コンドル(ファボ0のレポ)
コンドルは死肉を食べる(ハゲワシも一緒)。頭に毛がない理由は、毛に死肉の細菌がつかないようにするため。また、殺菌のために日光浴もする。
母集団
調査の対象となる全データのこと。
3つの統計解析
統計解析は大きく分けて記述統計と推測統計の2つに分けられる。ベイズ統計はおまけで足した
- 記述統計
演繹的な算法。母集団が判明しており、その母集団の特徴を求めるもの。例えば、あるクラス40人の身長の平均値を算出するなど。(クラス40人全ての身長が判明している)
- 推測統計
帰納的に推測する統計。母集団のうちからいくつかの標本を取り、その標本から母集団の特徴を推測するもの。例えば、世界中の人間の身長の平均値を算出するなど。
- ベイズ統計
上の2つとはちょっと毛色が違う(というか並列関係にない)
ベイズの定理を用いた統計学。詳しくは↓
noromap.hatenablog.com
推測統計(より詳細に)
- 観察集団(標本)のデータから母集団の特性を「推定」する
- 平均/分散/係数値などの推定(点推定)
- 点推定値のばらつきを調べる(区間推定)
- 検定統計量を用いた「検定」
推測統計では、母集団は大きくないとダメ。
入っている個数の少ないボックスガチャを考えてほしい。1個ガチャを引く(標本を抽出する)と、残りのガチャ全体(母集団)の特徴が変わってしまう。
記号の定義
大文字と小文字で表すものの違い
大文字…確率変数
小文字…具体的な数(実現値、観測値)
標本って具体的な数値じゃないの?と思うかもしれないし、実際そうだけど、
標本は抽出するたびに変わるから確率”変数”
標本を10個とってきてまた母集団に戻し、次にまた標本10個とってきたとき、
最初の10個と次の10個では値が全然異なっている。