統計的差別 | 用語解説

🔖 キーワード索引

統計的差別Statistical Discrimination倫理

本ページは 統計的差別（Statistical Discrimination）を多角的に解説します。上のチップは、検索・関連語の手がかりです。

💡 30秒で分かる結論

統計データに基づいて個人を判断することで生じる差別 ─ 経済学・AI 倫理の中心テーマ
「平均的にはこの属性は X」が個人に投影されると差別になる
AI で深刻化：採用、与信、保険、犯罪予測などで系統的偏見が生じる
対処：Fairness 指標、デバイアシング、制約付き学習、法的監督
「データが客観的」は幻想 ─ データは社会の偏見を反映する

📍 文脈 — どこで使う概念か

統計的差別（Statistical Discrimination）は、ケネス・アローらが 1970 年代に経済学で論じた概念。当時は労働市場での雇用差別が焦点でしたが、 21 世紀の AI 時代に新しい意味を持つようになりました。機械学習モデルが過去の偏ったデータから学び、偏見を再生産・増幅する問題です。

🎨 直感で掴む — 具体例で理解する

有名な統計的差別ケース：

事例	差別の構造
Amazon 採用 AI（2018）	過去 10 年の男性中心採用データで学習 → 女性の履歴書を低評価
COMPAS（米犯罪予測）	黒人を白人より高リスクと判定（ProPublica 2016）
Apple Card（2019）	同等所得でも女性の与信枠が低い
住宅ローン審査	郵便番号（地域）から人種を推定し差別
顔認識（暗い肌で誤認率高）	学習データの偏りが直接出る

共通構造：過去データの偏見 → モデルが学習 → 自動化された差別。「アルゴリズムは公平」という幻想を打ち砕く事例群。

📐 定義・数式

公平性の定量指標例：

【Demographic Parity（人口統計学的均等）】

$$P(\hat{Y}=1 | A=0) = P(\hat{Y}=1 | A=1)$$

予測陽性率がグループ間で等しい

【Equal Opportunity】

$$P(\hat{Y}=1 | Y=1, A=0) = P(\hat{Y}=1 | Y=1, A=1)$$

真陽性率がグループ間で等しい（資格あり者の検出率が公平）

🔬 記号・要素の読み解き

$\hat{Y}$: モデルの予測（1 = 陽性、 0 = 陰性）
$Y$: 真のラベル
$A$: 保護属性（性別、人種、年齢など）
Demographic Parity: 「採用率」がグループで同じ
Equal Opportunity: 「資格者の採用率」がグループで同じ
Calibration: 予測スコアの校正がグループで同じ
不可能性定理: これら 3 指標は同時に成立しないことが証明されている

🧮 数値例・実値計算

COMPAS の指標例：

指標	白人	黒人	判定
偽陽性率（再犯しないのに高リスク予測）	23%	45%	❌ 不公平
偽陰性率（再犯するのに低リスク予測）	48%	28%	❌ 不公平
精度（予測スコアの校正）	0.67	0.63	○ ほぼ同等

精度（calibration）は公平だが、誤分類のタイプがグループで違う。これは不可能性定理の現れ。

🐍 Python 実装例

最小コードで動かしてみる例：

from fairlearn.metrics import (
    demographic_parity_difference,
    equalized_odds_difference,
)

# モデル予測の公平性チェック
y_pred = model.predict(X_test)
sensitive = X_test['性別']  # 保護属性

dpd = demographic_parity_difference(
    y_true=y_test, y_pred=y_pred, sensitive_features=sensitive
)
eod = equalized_odds_difference(
    y_true=y_test, y_pred=y_pred, sensitive_features=sensitive
)
print(f'人口統計学的均等: {dpd:.3f}, 機会均等: {eod:.3f}')

⚠️ よくある落とし穴

❌ 「保護属性を入れなければ OK」の誤解

性別を除いても、郵便番号や名前から推定されることが多い（プロキシ変数）。

❌ 精度と公平性のトレードオフ

公平性制約を入れると、通常は全体精度が下がる。経営判断が必要。

❌ 不可能性定理

Demographic Parity と Equal Opportunity を同時に満たすことは数学的に不可能。何を優先するか選択。

❌ ラベル自体の偏り

「採用された」というラベルが過去の差別を反映している場合、公平性指標を満たしても根本解決にならない。

❌ 文化的相対性

「公平」の定義は文化・国・時代で異なる。グローバル製品では特に難しい。