yProcessingClub

すみません、許してください

条件付き確率についてのメモ

はじめに

条件付き確率とは以下のようなものである.
P(A|B):事象Bが起きたという条件における事象Aが起きる確率

なんにも分からん

P(A \cap B):事象Aが起きてかつ事象Bが起きる確率
と何が違うのかと疑問に思ったので簡単にメモにまとめることにする.

当方は確率なーんも知らん(高校時代に数学Aの授業で確率の勉強をしたくらい)ので,メモに信頼性は無いので注意.

具体例

以下のような例で考えてみる.
事象A:ある街で雷が落ちる事象
事象B:ある街で雨が降る事象

まず事象Bについて考える.
ある街の天気を10日間分記録した.表にしてみると以下のようになった.
(雨が降らない=0,雨が降った=1とする.)

id 雨が降った
x_1 0
x_2 0
x_3 0
x_4 0
x_5 0
x_6 1
x_7 1
x_8 1
x_9 1
x_{10} 1

雨が降らなかった日が5日間,雨が降った日は5日間だ.

次に,これを図にしてみる.
f:id:Yuri-Processing-Club:20210926090136p:plain

なお,ある街で雨が降る事象B=\{x_6, x_7, x_8, x_9, x_{10}\}である.
また,\bar{B}=\{ x_1,x_2,x_3,x_4,x_5\}であり,
全事象U=B+\bar{B}=\{x_1,x_2,x_3,x_4,x_5,x_6, x_7, x_8, x_9, x_{10}\}である.

ここで,Bが起きる確率P(B)は,
P(B)=\frac{n(B)}{n(U)}=\frac{5}{10}=0.5
となることはすぐに分かる.(n(X)Xの個数)


次に,雷が落ちる場合も合わせて考えると以下のようになった.

id 雷が落ちる 雨が降る
x_1 0 0
x_2 0 0
x_3 0 0
x_4 0 0
x_5 1 0
x_6 0 1
x_7 0 1
x_8 1 1
x_9 1 1
x_{10} 1 1

再度これを図にしてみる.

f:id:Yuri-Processing-Club:20210926090818p:plain

また,ある街で雷が落ちる事象A=\{x_5,x_8, x_9, x_{10}\}
\bar{A}=\{x_1,x_2,x_3,x_4,x_6, x_7\}
U=A+\bar{A}=\{x_1,x_2,x_3,x_4,x_5,x_6, x_7, x_8, x_9, x_{10}\}

P(A)=\frac{n(A)}{n(U)}=\frac{4}{10}=0.4


積事象

条件付き確率の前に,積事象P(A \cap B)についてまとめる.

雨が降ってかつ雷が落ちたのは,下図の青で塗った部分である.
f:id:Yuri-Processing-Club:20210926093123p:plain

A \cap B=\{x_8, x_9, x_{10}\}
\overline{{A \cap B}}=\{x_1,x_2,x_3,x_4,x_5,x_6, x_7\}
U=A \cap B+\overline{A \cap B}=\{x_1,x_2,x_3,x_4,x_5,x_6, x_7, x_8, x_9, x_{10}\}

P(A \cap B)=\frac{n(A \cap B)}{n(U)}=\frac{3}{10}=0.3

条件付き確率

事象Bが起きたという条件を考えると,次のようになる.
f:id:Yuri-Processing-Club:20210926094235p:plain

世界から事象Bが起きない(雨が降らない)という場合が抹消されている.
だって,事象Bが起きたという条件があるのだから.
事象Bが起きない場合は一切考える必要がない.

上図から,全事象U=B=\{ x_6, x_7, x_8, x_9, x_{10}\}
A|B=\{x_8, x_9, x_{10}\}
となり,
P(A | B)=\frac{n(A | B)}{n(U)}=\frac{3}{5}=0.6
となった.

P(A | B)>P(A)という結果になった.
これは常識的に考えると,雨が降った日のほうが雷が落ちる可能性が高いわけで,雨が絶対に降る世界における雷が落ちる確率P(A|B)のほうが雨が降らない日もある世界の雷が落ちる確率P(A)よりも確率が高いのは何となく分かる.

公式との比較

今までに求めてきた値を公式に代入して,結果が一致することを確認する.
P(A|B)=\frac{P(A \cap B)}{P(B)}=\frac{0.3}{0.5}=0.6
なるほど,確かに一致した.

条件付き確率その2

事象Aが起きたという条件を考えると,次のようになる.

f:id:Yuri-Processing-Club:20210926100652p:plain

雷が落ちない場合は抹消されたので,小さい世界となった.
B|A=\{ x_8,x_9,x_{10}\}U=\{ x_5,x_8,x_9,x_{10}\}であり,
P(B|A)=\frac{3}{4}=0.75である.


最後にベイズの定理に当てはめてみる.

P(B|A)=\frac{P(B)P(A|B)}{P(A)} = \frac{0.5*0.6}{0.4}=0.75
となり,結果が一致した.

まとめ

メモにしたことで,何となく腑に落ちた感じがする.
条件付きというのはその条件に当てはまらないケースを世界から抹消するという考え方を学んだ.

次は事後確率について和解をしていく.