「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
ベイズ主義(ベイズ統計)と
頻度主義(一般的に扱われる統計)
ベイズ主義 | 頻度主義 | |
母数 | 確率定数 | 変数 |
データ | 変数 | 確率定数 |
主観確率を扱う統計学
「事象X, 前提条件Yの条件付き確率から、
前提条件X, 事象Yの条件付き確率(原因の確率)を求める」
ことができる。
「観測したP(B∣A)、P(A) 、P(B)を使用してP(A∣B)を推定する。」の
Aを仮説H、BをデータDと置き換えた、
「観測したP(D∣H)、P(H) 、P(D)を使用してP(H∣D)を推定する。」の
公式としては、
P(D)=∑P(D∣Hi)×P(Hi)
合計 | 陽性(Y1) | 陰性(Y2) | |
罹患者(X1) | 20/100,000 = 0.0002 | 0.0002*0.8 | 0.0002*0.2 |
健康な人(X2) | 1 - 20/10,000 = 0.9998 | 0.9998*0.05 | 0.9998*0.95 |
= 病気に罹患している確率 * (実際に罹患している人が検査で陽性となる確率 / 陽性になる確率) = (0.0002*0.8) / ((0.0002*0.8) + (0.9998*0.05)) = 0.00319042871385842472582253240279 ≒ 0.0032 ≒ 0.32%
学校Aの生徒X人・男女比a:b、学校Bの生徒Y人・男女比c:dで、
入力データについて女子の時、学校A/Bに属する確率、的な問題。
※ P(目的変数|説明変数)
((1/3)*(1/8))/(((1/3)*(1/8))+((1/9)*(1/2))+((5/9)*(3/8)))=3/22
((1/9)*(1/2))/(((1/3)*(1/8))+((1/9)*(1/2))+((5/9)*(3/8)))=4/22
((5/9)*(3/8))/(((1/3)*(1/8))+((1/9)*(1/2))+((5/9)*(3/8)))=15/22
合計 | URL有り(Y1) | URL無し(Y2) | |
迷惑メール(X1) | 0.3 | 0.3*0.6 | 0.3*0.4 |
正常なメール(X2) | 1 - 0.3 = 0.7 | 0.7*0.1 | 0.7*0.9 |
= 迷惑メールの確率 * (迷惑メールの中でURL付きである確率 / 全メールの中でURL付きである確率) = 0.3 * ( 0.6 / (0.3*0.6) + (0.7*0.1) ) = 0.72
統計モデルのパラダイムシフトとして
記述能力と汎化能力のトレードオフを回避するパラメタθ
自体にも統計モデルを想定するような統計モデルの一種
※ ステークホルダー・マネジメントが重要である模様
ベイズモデルのマルコフ連鎖モンテカルロ法(MCMC)を使用して、
消費者の行動の結果データで観測されている変数だけでなく、
その背後に存在する観測できない潜在変数までも含めて因果性を評価する。