高卒フリーターがAIエンジニアを目指す

機械学習・Python・数学 の勉強メモ

【確率統計】ベイズの定理

youtu.be

条件付き確率

Xが起こった下でYが成り立つ確率P(Y|X)は
P(Y|X)=\frac{P(X,Y) : XかつYの確率}{P(X)}…①
意味として解釈すると、原因Xによって結果Yが起きる確率。

ベイズの定理

上の式を利用して変形していく。
①の式のXとYを入れ替えると
P(X|Y)=\frac{P(X,Y)}{P(Y)}…②
また①の式より
P(X,Y) = \frac{P(Y|X)}{P(X)}…③
③を②に代入すると
P(X|Y)=\frac{P(Y|X)P(X)}{P(Y)}…④

④の式は、ただ式変形で導き出されただけの式
しかし、これを意味として解釈すると、結果が生じている際の、原因の確率を探る、ということになる。因果関係を、結果→原因の順で追う。
観察結果から見て、前提条件がこうであった、と推測するような式になる。
こういうのを尤度だとか言うらしい。尤もらしさ(もっともらしさ)。

罹患率・陽性・陰性・偽陽性偽陰性

病気の診断のときにこの定理が発揮される。
ざっくり書くと、罹患率0.01%の病気の診断で、陽性だと診断された場合、実際に陽性である確率はかなり低い。
これは、診断結果から病気(原因)の確率を求めることになる。
罹患率…その病気にかかっている確率。人口1億人の国で1万人がかかっている病気の罹患率は、1万割る1億。

事前確率、情報、事後確率

罹患率0.01%の病気の診断で陽性だと診断された場合、その病気にかかっている確率は0.05%になったとする。
このとき、罹患率は事前確率、診断は情報、0.05%は事後確率、のように呼ばれる。

確率の更新プロセス

事前確率→(情報を与える)→事後確率、のように、ベイズの定理は確率更新に用いられる。
こういう手法を逐次ベイズ推定と呼ばれたりする。