論文一覧に戻る 📚 用語集トップ 🗺 概念マップ
📚 用語解説
📚 用語解説
ベイズの定理
Bayes' Theorem
推測統計
別称: ベイズ定理

🔖 キーワード索引

ベイズ事後確率尤度事前分布MAP確率推論

💡 30秒で分かる結論

ベイズの定理 ── 事前確率と尤度から事後確率を求める定理

📍 文脈 ── どこで出会うか

ベイズは「データを見るたびに信念を更新する」枠組み。 確率を「データを増やしながら精製する泥」と捉える、 直感に合う考え方です。 機械学習・統計の幅広い基礎理論でもあります。

🎨 直感で掴む

迷惑メール判定:

事前 0.5 → 事後 0.89 と更新された。 これが Naive Bayes 分類器の原理。

📐 定義/数式

【ベイズの定理】
$$ P(H \mid D) = \frac{P(D \mid H) \, P(H)}{P(D)} $$
$H$=仮説、 $D$=データ。 事前と尤度から事後を求める
【総乗で書く】
$$ \text{事後} \propto \text{尤度} \times \text{事前} $$
分母は正規化定数。 比例関係を見るだけなら省略可

🔬 記号を読み解く

P(H)
事前確率(prior)。 データを見る前の信念
P(D|H)
尤度(likelihood)。 仮説の下でデータが出る確率
P(H|D)
事後確率(posterior)。 データ反映後の信念
P(D)
周辺尤度(evidence)。 正規化定数
MAP推定
事後を最大化する仮説を選ぶ

🧮 実値で計算してみる

医療診断の古典問題:稀な病気の検査

「99%精度」と聞いて病気確定だと思いがちだが、 実は50%。 ベイズの直感反する重要例。

🐍 Python 実装

最小限のスニペットで動作確認できる例。 公的データ(SSDSE 等)を想定しています。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
# ベイズの定理を1関数で
def bayes(p_h, p_d_given_h, p_d_given_not_h):
    p_d = p_d_given_h * p_h + p_d_given_not_h * (1 - p_h)
    return p_d_given_h * p_h / p_d

# 上記の医療診断例
print(bayes(p_h=0.01, p_d_given_h=0.99, p_d_given_not_h=0.01))   # 0.50

# Naive Bayes 分類器(sklearn)
from sklearn.naive_bayes import MultinomialNB
model = MultinomialNB().fit(X_train, y_train)
print(model.predict_proba(X_test[:3]))

⚠️ よくある落とし穴

❌ 1. 基準率の無視
医療診断の例のように、 事前確率を無視するとミスリード
❌ 2. 独立性仮定の過信
Naive Bayes は特徴量独立を仮定。 文脈次第で精度低下
❌ 3. 事前分布の恣意性
無情報事前?共役事前?選択で結果が変わる
❌ 4. 事後確率と信頼区間の混同
ベイズの95%信用区間と頻度論の95%CIは意味が違う
❌ 5. 「ベイズなら主観OK」と無批判
事前分布の選び方は透明に報告すべき

📚 関連グループ教材

この用語の全体像を学ぶには、 横断的な教材で文脈を掴むのが効率的です。

🔎 深掘り解説

事前分布の選び方

状況事前分布
情報なし無情報事前(一様分布等)
専門家知識あり情報事前(中心と分散を指定)
解析的便利さ共役事前(尤度と組合せで解析解)
過剰反応を抑える弱情報事前(広めの正規分布等)
階層モデルハイパー事前(事前のさらに事前)

MCMC とは

事後分布が解析的に書けないとき、 マルコフ連鎖モンテカルロ法でサンプリング近似:

収束診断(R-hat < 1.1)と有効サンプル数(ESS)の確認が必須。

✅ 使う前のチェックリスト

📖 さらに学ぶには

本サイト内

外部リソース

困ったときは

  1. データの可視化(散布図、 ヒストグラム、 箱ひげ図)で異常を確認
  2. サンプルサイズ・欠損・外れ値を確認
  3. 仮定が満たされているか診断(正規性検定、 等分散性検定など)
  4. 類似研究での標準的な手法を確認
  5. 結果を複数手法でクロスチェック(頑健性確認)

🔎 深掘り解説

事前分布の選び方

状況事前分布
情報なし無情報事前(一様分布等)
専門家知識あり情報事前(中心と分散を指定)
解析的便利さ共役事前(尤度と組合せで解析解)
過剰反応を抑える弱情報事前(広めの正規分布等)
階層モデルハイパー事前(事前のさらに事前)

MCMC とは

事後分布が解析的に書けないとき、 マルコフ連鎖モンテカルロ法でサンプリング近似:

収束診断(R-hat < 1.1)と有効サンプル数(ESS)の確認が必須。

✅ 使う前のチェックリスト

📖 さらに学ぶには

本サイト内

外部リソース

困ったときは

  1. データの可視化(散布図、 ヒストグラム、 箱ひげ図)で異常を確認
  2. サンプルサイズ・欠損・外れ値を確認
  3. 仮定が満たされているか診断(正規性検定、 等分散性検定など)
  4. 類似研究での標準的な手法を確認
  5. 結果を複数手法でクロスチェック(頑健性確認)