実験計画法 | 用語解説

🔖 キーワード索引

実験計画法Design of Experiments推測統計DoE

本ページは 実験計画法（Design of Experiments）を多角的に解説します。上のチップは、検索・関連語の手がかりです。

💡 30秒で分かる結論

少ない試行で多くの因果効果を効率的に推定する実験設計の科学
Fisher（1925）が農学実験で確立 ─ 現代でも製薬・製造業・A/B テストの基盤
代表設計：完全無作為化、ブロック化、ラテン方格、直交配列、 RCT
3 原則：ランダム化、反復、局所管理（ブロック化）
Taguchi（田口）法は製造業の品質工学として日本発で世界標準

📍 文脈 — どこで使う概念か

実験計画法（Design of Experiments, DoE）は、 Ronald Fisher が農学実験の効率化のために生み出した分野。現在では 製薬の臨床試験、半導体の歩留まり改善、 Web の A/B テストなど、あらゆる「実験」の根幹技術です。統計的検定（ANOVA, t検定）と密接に結びついています。

🎨 直感で掴む — 具体例で理解する

Fisher の 3 原則：

原則	目的	方法
ランダム化	系統的偏りを排除	処置をランダムに割り当てる
反復	誤差を推定可能に	同条件を複数回
局所管理	環境変動を除く	類似条件をブロックに

例：肥料 A, B, C を比較したい場合 ─ 田んぼを 3 つに分けて適用するのではなく、各田んぼ内でランダムに小区画に割り当て、反復して測定。こうすれば「田んぼの差」と「肥料の差」が分離できます。

因子が多い場合は 直交配列表で組合せ爆発を抑制。「8 因子各 2 水準なら $2^8 = 256$ 通り」を 8 通りで済ませる魔法のような技。

📐 定義・数式

因子設計の分散分析モデル：

【二因子分散分析モデル】

$$Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \varepsilon_{ijk}$$

$\alpha_i$ = 因子 A、 $\beta_j$ = 因子 B、 $(\alpha\beta)_{ij}$ = 交互作用、 $\varepsilon$ = 誤差

🔬 記号・要素の読み解き

因子（factor）: 実験で操作する変数（肥料種、温度、圧力）
水準（level）: 各因子の値（A, B, C の 3 水準）
処置（treatment）: 因子と水準の組合せ
主効果: 因子単独の効果
交互作用: 2 因子以上の組合せ特有の効果
誤差: 実験から説明できない変動（再現性の限界）

🧮 数値例・実値計算

例：3 因子 2 水準の完全実施 vs 直交配列：

方法	実験数	推定可能な効果
完全実施 $2^3$	8	主効果 + すべての交互作用
$L_4$（半分実施）	4	主効果のみ（交互作用は交絡）
$L_8$ 直交配列	8	主効果 + 2因子交互作用

因子が増えると（例：7 因子 2 水準）、完全実施は $2^7 = 128$ 実験。 $L_8$ で 8 実験に圧縮可能（主効果のみ）。

🐍 Python 実装例

最小コードで動かしてみる例：

import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols

# 二元配置 ANOVA
df = pd.read_csv('data/raw/experiment.csv')

model = ols('収量 ~ C(肥料) + C(品種) + C(肥料):C(品種)', data=df).fit()
anova_table = sm.stats.anova_lm(model, typ=2)
print(anova_table)

⚠️ よくある落とし穴

❌ ランダム化失敗

「同じ条件のものをまとめて処理」すると、順序効果が混入。必ずランダム化。

❌ 反復不足

1 回ずつでは誤差が推定できず、結論が不安定。最低 3 反復推奨。

❌ 交互作用無視

「肥料 A は品種 X だけで効く」のような交互作用を見落とすと、結論を誤る。

❌ ブロック化忘れ

圃場の場所差、機器のロット差を無視すると、効果が誤差に紛れる。

❌ 交絡の理解不足

部分実施計画では一部の交互作用が主効果と区別できない。設計表を理解せず使うと危険。