論文一覧に戻る 📚 用語集トップ 🗺 概念マップ
📚 用語解説
📚 用語解説
統計的差別
Statistical Discrimination
倫理

🔖 キーワード索引

統計的差別Statistical Discrimination倫理

本ページは 統計的差別(Statistical Discrimination)を多角的に解説します。 上のチップは、 検索・関連語の手がかりです。

💡 30秒で分かる結論

📍 文脈 — どこで使う概念か

統計的差別(Statistical Discrimination)は、 ケネス・アローらが 1970 年代に経済学で論じた概念。 当時は労働市場での雇用差別が焦点でしたが、 21 世紀の AI 時代に新しい意味を持つようになりました。 機械学習モデルが過去の偏ったデータから学び、 偏見を再生産・増幅する問題です。

🎨 直感で掴む — 具体例で理解する

有名な統計的差別ケース:

事例差別の構造
Amazon 採用 AI(2018)過去 10 年の男性中心採用データで学習 → 女性の履歴書を低評価
COMPAS(米犯罪予測)黒人を白人より高リスクと判定(ProPublica 2016)
Apple Card(2019)同等所得でも女性の与信枠が低い
住宅ローン審査郵便番号(地域)から人種を推定し差別
顔認識(暗い肌で誤認率高)学習データの偏りが直接出る

共通構造:過去データの偏見 → モデルが学習 → 自動化された差別。 「アルゴリズムは公平」という幻想を打ち砕く事例群。

📐 定義・数式

公平性の定量指標例:

【Demographic Parity(人口統計学的均等)】
$$P(\hat{Y}=1 | A=0) = P(\hat{Y}=1 | A=1)$$
予測陽性率がグループ間で等しい
【Equal Opportunity】
$$P(\hat{Y}=1 | Y=1, A=0) = P(\hat{Y}=1 | Y=1, A=1)$$
真陽性率がグループ間で等しい(資格あり者の検出率が公平)

🔬 記号・要素の読み解き

$\hat{Y}$
モデルの予測(1 = 陽性、 0 = 陰性)
$Y$
真のラベル
$A$
保護属性(性別、 人種、 年齢など)
Demographic Parity
「採用率」がグループで同じ
Equal Opportunity
「資格者の採用率」がグループで同じ
Calibration
予測スコアの校正がグループで同じ
不可能性定理
これら 3 指標は同時に成立しないことが証明されている

🧮 数値例・実値計算

COMPAS の指標例:

指標白人黒人判定
偽陽性率(再犯しないのに高リスク予測)23%45%❌ 不公平
偽陰性率(再犯するのに低リスク予測)48%28%❌ 不公平
精度(予測スコアの校正)0.670.63○ ほぼ同等

精度(calibration)は公平だが、 誤分類のタイプがグループで違う。 これは 不可能性定理の現れ。

🐍 Python 実装例

最小コードで動かしてみる例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
from fairlearn.metrics import (
    demographic_parity_difference,
    equalized_odds_difference,
)

# モデル予測の公平性チェック
y_pred = model.predict(X_test)
sensitive = X_test['性別']  # 保護属性

dpd = demographic_parity_difference(
    y_true=y_test, y_pred=y_pred, sensitive_features=sensitive
)
eod = equalized_odds_difference(
    y_true=y_test, y_pred=y_pred, sensitive_features=sensitive
)
print(f'人口統計学的均等: {dpd:.3f}, 機会均等: {eod:.3f}')

⚠️ よくある落とし穴

❌ 「保護属性を入れなければ OK」の誤解
性別を除いても、 郵便番号や名前から推定されることが多い(プロキシ変数)。
❌ 精度と公平性のトレードオフ
公平性制約を入れると、 通常は全体精度が下がる。 経営判断が必要。
❌ 不可能性定理
Demographic Parity と Equal Opportunity を同時に満たすことは数学的に不可能。 何を優先するか選択。
❌ ラベル自体の偏り
「採用された」というラベルが過去の差別を反映している場合、 公平性指標を満たしても根本解決にならない。
❌ 文化的相対性
「公平」の定義は文化・国・時代で異なる。 グローバル製品では特に難しい。