ベイズの定理 | 用語解説

🔖 キーワード索引

ベイズ事後確率尤度事前分布MAP確率推論

📍 文脈 ── どこで出会うか

ベイズは「データを見るたびに信念を更新する」枠組み。確率を「データを増やしながら精製する泥」と捉える、直感に合う考え方です。機械学習・統計の幅広い基礎理論でもあります。

🎨 直感で掴む

迷惑メール判定：

事前確率：受信メールが迷惑である確率 P(spam) ≈ 0.5
尤度：単語「無料」が迷惑メールに出る確率 P(無料|spam) = 0.8
尤度：「無料」が通常メールに出る確率 P(無料|ham) = 0.1
あるメールに「無料」がある場合：P(spam|無料) = 0.8 × 0.5 / (0.8×0.5 + 0.1×0.5) ≈ 0.89

事前 0.5 → 事後 0.89 と更新された。これが Naive Bayes 分類器の原理。

📐 定義／数式

【ベイズの定理】

$$ P(H \mid D) = \frac{P(D \mid H) \, P(H)}{P(D)} $$

$H$=仮説、 $D$=データ。事前と尤度から事後を求める

【総乗で書く】

$$ \text{事後} \propto \text{尤度} \times \text{事前} $$

分母は正規化定数。比例関係を見るだけなら省略可

🔬 記号を読み解く

P(H): 事前確率（prior）。データを見る前の信念
P(D|H): 尤度（likelihood）。仮説の下でデータが出る確率
P(H|D): 事後確率（posterior）。データ反映後の信念
P(D): 周辺尤度（evidence）。正規化定数
MAP推定: 事後を最大化する仮説を選ぶ

🧮 実値で計算してみる

医療診断の古典問題：稀な病気の検査

有病率：P(病気) = 1% = 0.01
感度：P(陽性|病気) = 99%
特異度：P(陰性|健康) = 99%
陽性出た時、 P(病気|陽性) = 0.99×0.01 / (0.99×0.01 + 0.01×0.99) = 0.50

「99%精度」と聞いて病気確定だと思いがちだが、実は50%。ベイズの直感反する重要例。

🐍 Python 実装

最小限のスニペットで動作確認できる例。公的データ（SSDSE 等）を想定しています。

# ベイズの定理を1関数で
def bayes(p_h, p_d_given_h, p_d_given_not_h):
    p_d = p_d_given_h * p_h + p_d_given_not_h * (1 - p_h)
    return p_d_given_h * p_h / p_d

# 上記の医療診断例
print(bayes(p_h=0.01, p_d_given_h=0.99, p_d_given_not_h=0.01))   # 0.50

# Naive Bayes 分類器（sklearn）
from sklearn.naive_bayes import MultinomialNB
model = MultinomialNB().fit(X_train, y_train)
print(model.predict_proba(X_test[:3]))

⚠️ よくある落とし穴

❌ 1. 基準率の無視

医療診断の例のように、事前確率を無視するとミスリード

❌ 2. 独立性仮定の過信

Naive Bayes は特徴量独立を仮定。文脈次第で精度低下

❌ 3. 事前分布の恣意性

無情報事前？共役事前？選択で結果が変わる

❌ 4. 事後確率と信頼区間の混同

ベイズの95%信用区間と頻度論の95%CIは意味が違う

❌ 5. 「ベイズなら主観OK」と無批判

事前分布の選び方は透明に報告すべき

🌐 関連手法・派生

Naive Bayes 分類器 — 古典的だが今も有用
MCMC — 事後分布のサンプリング
変分推論 — 大規模ベイズの近似
PyMC / Stan — ベイズモデリング言語
共役事前分布 — 解析的に解ける組合せ

🔗 関連用語（前提・並列・発展）

役割で色分け：前提／上位／並列／発展／応用

[前提]確率 [前提]条件付き確率 [応用]Naive Bayes [発展]MCMC [並列]頻度主義

📚 関連グループ教材

この用語の全体像を学ぶには、横断的な教材で文脈を掴むのが効率的です。

🔎 深掘り解説

事前分布の選び方

状況	事前分布
情報なし	無情報事前（一様分布等）
専門家知識あり	情報事前（中心と分散を指定）
解析的便利さ	共役事前（尤度と組合せで解析解）
過剰反応を抑える	弱情報事前（広めの正規分布等）
階層モデル	ハイパー事前（事前のさらに事前）

MCMC とは

事後分布が解析的に書けないとき、 マルコフ連鎖モンテカルロ法でサンプリング近似：

Metropolis-Hastings：提案分布から候補を生成し受容／棄却
Gibbs サンプリング：条件付き分布から順番にサンプリング
HMC：勾配情報を使った高速版
NUTS：Stanのデフォルトサンプラ

収束診断（R-hat < 1.1）と有効サンプル数（ESS）の確認が必須。

✅ 使う前のチェックリスト

☐ ベイズの定理 が今のタスクに本当に適切か再確認した
☐ 前提条件（独立性、正規性、サンプル数等）を満たしているか確認した
☐ データの尺度・分布・欠損・外れ値を確認した
☐ 結果だけでなく「不確実性」（CI、標準誤差）も把握した
☐ 解釈と限界を区別して文書化した
☐ 関連する別の手法と比較したうえで本手法を選んだ
☐ 落とし穴（このページの ⚠️ セクション）に該当しないか確認した
☐ 関連グループ教材で全体像と位置付けを把握した

📖 さらに学ぶには

本サイト内

論文一覧に戻る — ベイズの定理 を実際に使った再現論文をハンズオン形式で読む
このページ上部の「🔗 関連用語」から派生概念へ
「📚 関連グループ教材」で横断的な学習教材へ

外部リソース

scikit-learn 公式ドキュメント — 標準実装と例
StatQuest with Josh Starmer (YouTube) — 直感的な統計／ML 解説
Cross Validated (Stack Exchange) — 統計／ML の質問サイト
arXiv — 最新の手法論文プレプリント

困ったときは

データの可視化（散布図、ヒストグラム、箱ひげ図）で異常を確認
サンプルサイズ・欠損・外れ値を確認
仮定が満たされているか診断（正規性検定、等分散性検定など）
類似研究での標準的な手法を確認
結果を複数手法でクロスチェック（頑健性確認）

🔎 深掘り解説

事前分布の選び方

状況	事前分布
情報なし	無情報事前（一様分布等）
専門家知識あり	情報事前（中心と分散を指定）
解析的便利さ	共役事前（尤度と組合せで解析解）
過剰反応を抑える	弱情報事前（広めの正規分布等）
階層モデル	ハイパー事前（事前のさらに事前）

MCMC とは

事後分布が解析的に書けないとき、 マルコフ連鎖モンテカルロ法でサンプリング近似：

Metropolis-Hastings：提案分布から候補を生成し受容／棄却
Gibbs サンプリング：条件付き分布から順番にサンプリング
HMC：勾配情報を使った高速版
NUTS：Stanのデフォルトサンプラ

収束診断（R-hat < 1.1）と有効サンプル数（ESS）の確認が必須。

✅ 使う前のチェックリスト

☐ ベイズの定理 が今のタスクに本当に適切か再確認した
☐ 前提条件（独立性、正規性、サンプル数等）を満たしているか確認した
☐ データの尺度・分布・欠損・外れ値を確認した
☐ 結果だけでなく「不確実性」（CI、標準誤差）も把握した
☐ 解釈と限界を区別して文書化した
☐ 関連する別の手法と比較したうえで本手法を選んだ
☐ 落とし穴（このページの ⚠️ セクション）に該当しないか確認した
☐ 関連グループ教材で全体像と位置付けを把握した

📖 さらに学ぶには

本サイト内

論文一覧に戻る — ベイズの定理 を実際に使った再現論文をハンズオン形式で読む
このページ上部の「🔗 関連用語」から派生概念へ
「📚 関連グループ教材」で横断的な学習教材へ

外部リソース

scikit-learn 公式ドキュメント — 標準実装と例
StatQuest with Josh Starmer (YouTube) — 直感的な統計／ML 解説
Cross Validated (Stack Exchange) — 統計／ML の質問サイト
arXiv — 最新の手法論文プレプリント

困ったときは

データの可視化（散布図、ヒストグラム、箱ひげ図）で異常を確認
サンプルサイズ・欠損・外れ値を確認
仮定が満たされているか診断（正規性検定、等分散性検定など）
類似研究での標準的な手法を確認
結果を複数手法でクロスチェック（頑健性確認）

📚 関連グループ教材

この用語の全体像を学ぶには、まず横断的な教材で文脈を掴むのが効率的です：

📚 標本抽出と中心極限定理 — このカテゴリの全体像を学ぶ
📚 仮説検定の枠組み — このカテゴリの全体像を学ぶ

🔗 同カテゴリの他用語

p値有意水準信頼区間サンプルサイズ標準誤差オッズ比母集団標本標本抽出点推定区間推定効果量実験計画法標本抽出と中心極限定理

🔖 キーワード索引

💡 30秒で分かる結論

📍 文脈 ── どこで出会うか

🎨 直感で掴む

📐 定義／数式

🔬 記号を読み解く

🧮 実値で計算してみる

🐍 Python 実装

⚠️ よくある落とし穴

🌐 関連手法・派生

🔗 関連用語（前提・並列・発展）

📚 関連グループ教材

🔎 深掘り解説

事前分布の選び方

MCMC とは

✅ 使う前のチェックリスト

📖 さらに学ぶには

本サイト内

外部リソース

困ったときは

🔎 深掘り解説

事前分布の選び方

MCMC とは

✅ 使う前のチェックリスト

📖 さらに学ぶには

本サイト内

外部リソース

困ったときは

📚 関連グループ教材

🔗 同カテゴリの他用語