F検定 (F-test) | 用語解説

👁️ 直感 — F検定は「分散比の検定」

F検定は2つの分散の比を検定する手法。もっとも頻繁に使う2つの応用：

分散分析（ANOVA）：3群以上の平均の差を検定
回帰モデル全体の有意性：「全係数=0」を検定

📐 F統計量

$$ F = \frac{s_1^2}{s_2^2} \sim F(df_1, df_2) $$

2つの分散の比。 F分布は非対称で 0 から始まり右側に裾を引きます。

ANOVA での F統計量

$$ F = \frac{\text{群間平均平方}}{\text{群内平均平方}} = \frac{MS_{\text{between}}}{MS_{\text{within}}} $$

F が大きいほど「群間差が大きい」=「群差は本物」の証拠。

🎯 一元配置 ANOVA — 3群以上の平均差

H₀: μ₁ = μ₂ = μ₃ = ... = μ_k（全群同じ）
H₁: 少なくとも1つの群が異なる

例：「東日本・中部・西日本で食料費の平均に差があるか？」

分散の分解

$$ \text{全分散} = \text{群間分散} + \text{群内分散} $$

群間分散が群内分散より十分大きければ「差あり」と判定。

事後検定

ANOVA で「差がある」と分かっても「どこに差があるか」は別の検定が必要：

Tukey HSD：全ペアの差を比較
Bonferroni：α 補正で多重比較
Dunnett：対照群との比較

🐍 Python での F検定

from scipy import stats

# F検定（分散比）
F, p = stats.f.cdf(s1**2/s2**2, df1, df2)

# 一元配置 ANOVA
F, p = stats.f_oneway(group1, group2, group3)

# 二元配置 ANOVA（statsmodels）
import statsmodels.api as sm
from statsmodels.formula.api import ols
model = ols('y ~ C(group1) + C(group2) + C(group1):C(group2)', data=df).fit()
print(sm.stats.anova_lm(model, typ=2))

# 事後検定（Tukey HSD）
from statsmodels.stats.multicomp import pairwise_tukeyhsd
tukey = pairwise_tukeyhsd(df['y'], df['group'])
print(tukey)

🚧 落とし穴と注意点

サンプルサイズを確認（小標本では結果が不安定）
仮定の検証（正規性、独立性、等分散性）
外れ値の影響を散布図で確認
多重比較問題（複数検定時は補正を）
p値だけで判断しない、効果量と信頼区間を併記
因果関係を主張するには別の根拠が必要

🔬 「F検定」を深く理解する

F分布の発見

Ronald A. Fisher（1925）が分散分析（ANOVA）で導入。「F」は Fisher の F。もとは George W. Snedecor が命名（1934）。

応用シナリオ

農業実験：肥料3種類の収量比較
臨床試験：治療法A・B・プラセボ
マーケティング：A/B/Cテスト
製造業：3つの工場の品質比較
回帰：モデル全体の有意性

効果量 η²（イータ二乗）

$$ \eta^2 = \frac{SS_{\text{between}}}{SS_{\text{total}}} $$

ANOVA の説明力。 0.01 小、 0.06 中、 0.14 大。

📝 練習問題 — 理解度チェック

この用語の基本定義を、自分の言葉で説明できますか？
この手法が使われる典型的なシナリオを3つ挙げられますか？
この手法の前提条件・仮定を確認できますか？
結果を解釈する際の注意点は何ですか？
類似手法との違いを説明できますか？
Python（または他言語）で実装できますか？
SSDSE データで応用例を作成できますか？

🔗 さらに学ぶための関連用語

このトピックの理解を深めるには、以下の関連概念も合わせて学習することをお勧めします。概念マップから直接ジャンプできます：

基礎：平均、分散、標準偏差、相関係数
推測：信頼区間、 p値、標準誤差、有意水準
関連手法：他の検定・回帰モデル
応用：機械学習での実装

📚 参考文献・さらなる学習

古典的教科書

Casella & Berger "Statistical Inference"
Wasserman "All of Statistics"
Hastie, Tibshirani & Friedman "The Elements of Statistical Learning"
Gelman & Hill "Data Analysis Using Regression and Multilevel/Hierarchical Models"

実践書

VanderPlas "Python Data Science Handbook"
McKinney "Python for Data Analysis"
James, Witten, Hastie & Tibshirani "An Introduction to Statistical Learning"

オンラインリソース

scikit-learn 公式ドキュメント
statsmodels 公式ドキュメント
scipy.stats リファレンス
SSDSE データ（統計データ活用コンペティション）

💼 実務応用ガイド

データサイエンスプロジェクトでの位置づけ

探索的分析（EDA）：基本統計量・可視化でデータを理解
前処理：標準化・正規化・欠損値処理
モデリング：回帰・分類・クラスタリング
評価：CV、指標計算、統計的検定
解釈・報告：効果量・信頼区間・可視化

業界別ユースケース

マーケティング：顧客セグメンテーション、 ROI 分析、 A/Bテスト
金融：ポートフォリオ最適化、リスク評価、信用スコアリング
医療：臨床試験、疫学研究、診断モデル
製造：品質管理、予測保全、工程最適化
公共政策：社会統計、政策効果分析、計画立案

📖 完全ガイド — 統計学習の参照表

分析の流れ — 8ステップ

問題定義：何を知りたいのか、目的を明確に
データ収集：信頼できるソースから（SSDSEなど公的データ）
データクリーニング：欠損値、外れ値、入力ミスの確認
探索的分析（EDA）：要約統計量、ヒストグラム、散布図
変数変換：標準化、対数変換、カテゴリのエンコード
モデリング：適切な手法を選び、学習
評価：CV、指標、統計的検定
解釈・報告：効果量、信頼区間、可視化

統計手法の選び方マトリクス

目的	1変数	2変数	多変量
記述	平均, 中央値, 分散	相関, 共分散	PCA, 因子分析
可視化	ヒストグラム, 箱ひげ	散布図, ヒートマップ	散布図行列, バイプロット
予測	時系列モデル	単回帰	重回帰, Ridge, LASSO
分類	ロジスティック回帰	判別分析	SVM, RF, NN
グループ化	階級分け	2次元クラスタリング	k-means, 階層クラスタリング
検定	1標本t検定	2標本t検定, χ²	ANOVA, MANOVA

サンプル数別の手法ガイド

n	推奨手法
n < 10	記述統計のみ、ノンパラ検定、ベイズ統計
10 ≤ n < 30	t検定, ブートストラップ, 単回帰
30 ≤ n < 200	重回帰, ANOVA, 階層クラスタリング
200 ≤ n < 10000	複雑な回帰, RF, GBM, k-means
n ≥ 10000	深層学習, 大規模分散学習

Python 主要ライブラリ早見表

ライブラリ	用途
numpy	数値計算の基礎、行列演算
pandas	データフレーム、表操作
scipy	統計関数、最適化、線形代数
statsmodels	古典統計、検定、回帰分析の詳細
scikit-learn	機械学習、前処理、評価
matplotlib	基本可視化
seaborn	統計的可視化（高級）
plotly	インタラクティブ可視化
xgboost / lightgbm	勾配ブースティング
PyTorch / TensorFlow	深層学習

よくある質問（FAQ）

Q: 正規分布じゃないデータをどう扱う？
A: 対数変換、 Box-Cox 変換、ノンパラ検定、ブートストラップ
Q: 外れ値を除くべき？
A: ドメイン知識で判断。機械的に除くより、ロバスト手法を検討
Q: サンプルサイズはいくつあれば十分？
A: 効果量と検出力から事前計算（power analysis）
Q: p < 0.05 で「効果あり」と結論していい？
A: 効果量と信頼区間も併記。多重比較補正も
Q: 相関があれば因果がある？
A: ない。 RCT、 IV、 DiD などの因果推論手法が必要

📓 用語のまとめ — 30秒で理解

このページで扱った概念を、学習効率のためにまとめます。これを毎日見ることで、統計の基礎が体に染み込みます。

必ず押さえるべき記号

記号	意味	読み方
μ	母平均	ミュー
σ	母標準偏差	シグマ
σ²	母分散	シグマ二乗
x̄	標本平均	エックスバー
s	標本標準偏差	エス
n	標本サイズ	エヌ
p	p値、比率	ピー
α	有意水準	アルファ
β	回帰係数、第二種誤り率	ベータ
r	相関係数	アール
R²	決定係数	アール二乗
Σ	総和記号、共分散行列	シグマ大文字
N(μ, σ²)	正規分布	ノーマルミューシグマ二乗
t(df)	t分布	ティー
χ²(df)	カイ二乗分布	カイ二乗
F(d1, d2)	F分布	エフ
H₀, H₁	帰無仮説、対立仮説	エイチゼロ、エイチワン
E[X]	期待値	エクスペクタンス
Var(X)	分散	バリアンス
Cov(X, Y)	共分散	カバリアンス

💡 統計学・データサイエンスは「記号の意味を理解する」ことが最初の壁。各記号が何を表すか、公式の中での役割を覚えてしまえば、後はパターンの組合せで様々な手法が理解できます。

🌐 データサイエンス全体像での位置づけ

データサイエンスのワークフロー

ビジネス理解：何を解決したいか
データ理解：どんなデータがあるか
データ準備：前処理、特徴量エンジニアリング
モデリング：手法選択、学習
評価：性能、解釈性、ビジネス価値
展開：実装、運用、監視

(CRISP-DM プロセスより)

主要分野のマッピング

分野	主要技術	代表ツール
記述統計	要約量、可視化	pandas, matplotlib
推測統計	検定、信頼区間	scipy.stats, statsmodels
機械学習	予測、分類、クラスタリング	scikit-learn, XGBoost
深層学習	NN、画像、自然言語	PyTorch, TensorFlow
時系列	ARIMA、状態空間、 LSTM	statsmodels, prophet
因果推論	RCT、 IV、 DiD、 PSM	DoWhy, EconML
ベイズ統計	MCMC、変分推論	PyMC, Stan
最適化	線形/凸/離散最適化	scipy.optimize, cvxpy

キャリアパス

データアナリスト：記述統計、可視化、 BI
データサイエンティスト：機械学習、統計モデリング
機械学習エンジニア：モデル実装、デプロイ、 MLOps
統計学者・計量経済学者：因果推論、統計的検定
研究者：新しい手法開発

💎 良いデータ分析のための10のコツ

必ず可視化から始める：散布図、ヒストグラム、箱ひげ図
外れ値を意識する：除く前にドメイン的に理解
仮定を確認する：正規性、独立性、等分散性
サンプルサイズに見合う複雑性：n=10 で深層学習はしない
効果量も併記する：p値だけでは不十分
信頼区間で不確実性を示す：点推定だけでは誤解の元
多重比較を補正する：探索的解析でも誠実に
ホールドアウト or CV で評価する：訓練データの精度は意味がない
解釈可能性も重視する：ブラックボックスより white-box
再現可能なコードを書く：random_seed、バージョン管理

🔗 用語間の関係 — 統計概念のネットワーク

記述統計の基本セット

これらは互いに深く関連します：

平均：データの重心 → 偏差の合計はゼロ
分散：偏差の二乗の平均 → 平均からの広がり
標準偏差：分散の平方根 → 元の単位
共分散：2変数の偏差の積の平均 → 一緒に動くか
相関係数：共分散を標準偏差で割ったもの → 単位なし

推測統計の基本セット

標準誤差：推定値のばらつき = σ/√n
信頼区間：x̄ ± z × SE
p値：H₀ のもとでの確率
有意水準 α：許容する第一種誤り率
検出力 1-β：差を見つける確率
効果量：差の大きさ（標準化済み）

回帰モデルファミリー

単回帰：1変数 → 1変数の予測
重回帰：多変数 → 1変数
Ridge：L2正則化付き重回帰
LASSO：L1正則化（変数選択付き）
Elastic Net：L1+L2の組合せ
ロジスティック回帰：分類用
ポアソン回帰：カウントデータ用

クラスタリング・次元削減ファミリー

k-means：分割クラスタリング
階層クラスタリング：ツリー構造
Ward法：分散最小化の階層クラスタリング
DBSCAN：密度ベース
PCA：線形次元削減
因子分析：潜在因子モデル
t-SNE, UMAP：非線形次元削減

検定ファミリー

t検定：1〜2 群の平均比較
F検定（ANOVA）：3群以上の平均比較
χ²検定：カテゴリ変数の独立性
Mann-Whitney U：t検定のノンパラ版
Kruskal-Wallis：ANOVAのノンパラ版
Wilcoxon：対応のあるt検定のノンパラ版

🗺️ 概念マップ — 3つの視点で体系を理解する

F検定 がデータサイエンスの体系の中でどこに位置するかを、 3つの異なる視点で可視化します。同じ情報でも見方を変えると気付きが変わります。

📍 体系階層のパス

🌐 統計・データサイエンス › 推測統計 › 検定 › F検定

① 🔗 関係マップ — 「他の手法とどう繋がっているか」

中心の概念から放射状に、前提・兄弟・発展形・応用先などの関係性を矢印で結びます。 横の繋がりを見るのに最適。ノードをドラッグ、ホイールでズーム、クリックで遷移。

凡例：現在の用語上位カテゴリ兄弟（並列）前提発展形応用先2階層先

② ⭕ 包含マップ — 「どのカテゴリに含まれているか」

大きな円が小さな円を包含する Circle Packing 図。 「F検定」は緑色でハイライト。

カテゴリ円をクリック：その内部にズームイン
白背景クリック：1階層戻る
用語円をクリック：詳細ページへ遷移
マウスホバー：階層パス表示

📍現在地：統計・データサイエンス

③ 🌳 ツリーマップ — 「面積で見るボリューム比較」

長方形を入れ子に分割した Treemap 図。 各分野の規模感を面積で比較。 「F検定」は緑色でハイライト。

カテゴリ矩形をクリック：その内部にドリルダウン
パンくず（上のリンク）クリック：その階層に戻る
用語矩形をクリック：詳細ページへ遷移
マウスホバー：階層パスと値を表示

📍パンくず：統計・データサイエンス

🎯 3つのマップの使い分け

マップ	分かること	こんな時に見る
🔗 関係マップ	手法間の横の関係（前提→発展→応用）	「次に何を学べばよい？」学習順序の判断
⭕ 包含マップ	分類体系の入れ子構造（上位⊃下位）	「この手法はどんなジャンルに属する？」
🌳 ツリーマップ	分野の規模比較（面積=ボリューム）	「データサイエンス全体の俯瞰像」

💡 ジャストインタイム学習のヒント：3つの視点を行き来することで、概念を多角的に理解できます。包含マップやツリーマップはズーム/ドリルダウンで大分類から細部まで探索できます。

🔖 キーワード索引 — F 検定を多角的に理解する

F 検定（F-test）を確実に理解するための関連キーワードを、難易度別に整理しました。

🟢 基礎キーワード（まず押さえる）

F 統計量：2 つの分散の比 s₁²/s₂²。自由度 (df₁, df₂) の F 分布に従う。
F 分布：自由度 2 つを持つ非対称な右に裾を引く分布。 χ² 分布から派生。
分散の同等性検定（等分散性検定）：2 群の分散が等しいかを検定する F 検定の典型的な使い方。
分散分析（ANOVA）：3 群以上の平均の差を検定するための F 検定の最重要応用。
群間分散・群内分散：ANOVA で計算する 2 種類の分散。 F = MS_between / MS_within。
自由度（degree of freedom）：分子 df₁ = k − 1、分母 df₂ = N − k（k は群数、 N は全サンプル数）。

🟡 中級キーワード

偏 F 検定（partial F-test）：重回帰で複数係数を同時に検定するときの F 統計量。
Levene 検定 / Bartlett 検定：等分散性検定として F 検定よりロバストな代替手法。
Welch の ANOVA：分散が等しくない場合の修正 ANOVA。
多重比較（Tukey HSD、 Bonferroni）：ANOVA で有意になった後、どの群間に差があるか調べる事後検定。
F 分布の片側 vs 両側：通常は右側のみを棄却域とするが、分散比検定では両側にすることもある。
効果量（η², ω²）：ANOVA における効果の大きさ。 p 値とは独立に報告すべき。

🔴 上級キーワード

反復測定 ANOVA（repeated measures ANOVA）：同一被験者を複数回測定する設計に対する F 検定。
MANOVA（多変量分散分析）：複数の従属変数に対する分散分析。 F 統計量を Wilks の Λ などで計算。
線形混合モデル（LMM）の F 検定：ランダム効果を含むモデルで Satterthwaite 法による近似 F 検定。
F 検定と尤度比検定の関係：正規誤差を仮定すると両者は漸近的に等価。
非心 F 分布：対立仮説下での F 統計量の分布。検定力計算に使う。

🧮 SSDSE-B-2026 実値計算例 — F 検定を 47 都道府県データで実行

合成データではなく公的統計（SSDSE-B-2026 を想定）で F 検定の具体的な計算手順を見せます。

① 等分散性の検定：「都市圏 vs 地方」で人口密度の分散は等しいか？

47 都道府県を都市圏（東京・神奈川・大阪・愛知・埼玉・千葉・兵庫・福岡）8 県とそれ以外 39 県に分けて、人口密度の分散を比較します。

都市圏 8 県の人口密度（人/km²）：おおよそ 6400, 3820, 4640, 1450, 1930, 1220, 650, 1020
地方 39 県の平均的な人口密度：おおよそ 100〜500

# 分散の概算
都市圏 s₁² ≈ 4_200_000（東京の 6400 が支配的）
地方   s₂² ≈ 25_000

F = s₁² / s₂² = 4_200_000 / 25_000 ≈ 168
df₁ = 7, df₂ = 38

F 分布の臨界値（α=0.05、 右側）：F(7, 38) ≈ 2.27
→ 168 >> 2.27 なので帰無仮説（等分散）を強く棄却

結論：都市圏の人口密度は地方よりも著しく分散が大きい
→ 2 群の t 検定では Welch 補正版を使うべき

② ANOVA：「気候区分（北・中・南・西）4 区分」で平均寿命に差があるか？

47 都道府県を地理的に 4 区分し、平均寿命（仮想値、単位：年）の差を ANOVA で検定します。

# 各群の平均寿命（仮想例、 実際は男女別など）
北日本（北海道・東北 7 県）：平均 84.1、 分散 0.32
中日本（関東・中部 14 県）：平均 84.6、 分散 0.41
南日本（近畿・四国 10 県）：平均 84.8、 分散 0.28
西日本（九州・沖縄 8 県）：平均 84.5、 分散 0.46
全体平均（grand mean）≈ 84.55、 N = 47、 k = 4

群間平方和 SS_between = Σ nᵢ(x̄ᵢ - x̄)²
= 7(84.1-84.55)² + 14(84.6-84.55)² + 10(84.8-84.55)² + 8(84.5-84.55)²
≈ 7·0.2025 + 14·0.0025 + 10·0.0625 + 8·0.0025
≈ 1.418 + 0.035 + 0.625 + 0.020 ≈ 2.10

群内平方和 SS_within = Σ (nᵢ-1)·sᵢ²
= 6·0.32 + 13·0.41 + 9·0.28 + 7·0.46
≈ 1.92 + 5.33 + 2.52 + 3.22 ≈ 12.99

MS_between = 2.10 / (4-1) = 0.70
MS_within  = 12.99 / (47-4) = 0.302

F = 0.70 / 0.302 ≈ 2.32
df₁ = 3, df₂ = 43

F 分布の臨界値 F(3, 43, α=0.05) ≈ 2.82
→ 2.32 < 2.82 なので有意でない
p 値 ≈ 0.088

結論：4 区分間で平均寿命の差は有意でない（α=0.05 で）

③ 効果量 η² の計算

η² = SS_between / (SS_between + SS_within)
   = 2.10 / (2.10 + 12.99)
   ≈ 0.139

Cohen の基準：
- η² ≈ 0.01 → 小
- η² ≈ 0.06 → 中
- η² ≈ 0.14 → 大

→ 効果量は「大きい」が、 サンプルが少なく統計的有意性に届かなかった可能性。
  追加データやサンプルサイズの再設計を検討。

⚠️ F 検定の落とし穴 — 実務で必ず引っかかるポイント 7 選

① F 検定は正規性に「敏感」である

t 検定は中心極限定理で正規性の崩れに比較的頑健ですが、 F 検定（特に等分散性検定）は正規性の崩れに敏感です。裾が重い・歪んだ分布では F 検定の Type I エラー率が大きく狂います。 47 都道府県の人口や所得のような分布では、等分散性検定として F 検定よりも Levene 検定や Brown–Forsythe 検定を使う方が頑健です。正規性は QQ プロットや Shapiro–Wilk で必ず確認しましょう。

② ANOVA が有意でも「どの群間に差があるか」は分からない

ANOVA の F 検定は「少なくとも 1 つの群が他と違う」を示すだけで、 どのペアが違うかは別途多重比較が必要です。単純に各ペアで t 検定を 3 回（3 群なら）行うと、全体の Type I エラーが 5% を超え（約 14%）、偽陽性が増えます。 Tukey HSD や Bonferroni、 Holm 法など、群数に応じた補正を必ず適用してください。

③ サンプルサイズが大きいと「実質的に同じ分散」でも有意になる

F 検定はサンプル数が大きくなるほど検出力が上がるため、 実質的に無視できる差でも統計的に有意と判定されます。例えば s₁² = 100、 s₂² = 105 でも N = 1000 ずつあれば有意になりますが、実務的にこの差は無意味です。必ず効果量（η², 分散比そのもの）と組み合わせて報告し、統計的有意性と実質的有意性を区別しましょう。

④ 「等分散性の前検定 → t 検定」という二段階手続きは推奨されない

かつては「F 検定で等分散を確認してから Student の t 検定、等分散でなければ Welch の t 検定」という流れが推奨されました。しかし現代の統計学では、 初めから Welch の t 検定（または Welch の ANOVA）を使う方が安全とされています。二段階手続きは Type I エラーが累積し、等分散性の検定自体の検出力も問題になります。

⑤ F 分布は右に裾を引く非対称分布である

正規分布や t 分布と違い、 F 分布は左右対称ではなく、値は常に正です。分散比を計算するときは慣例的に「大きい分散 / 小さい分散」として F ≥ 1 とし、右側のみを棄却域として α/2 で見ます（両側検定の場合）。単純に「F = s₁²/s₂² が 0.5 だから棄却しない」と判断してはいけません。

⑥ 反復測定データに通常の ANOVA を適用してしまう

同一被験者を複数時点で測定したデータに通常の one-way ANOVA を適用すると、観測の独立性が壊れ F 統計量が過大 / 過小評価されます。反復測定 ANOVA、混合効果モデル（lme4 / statsmodels.MixedLM）、 GEE などの相関構造を扱える手法を使う必要があります。球面性の仮定（Mauchly 検定）にも注意。

⑦ 群サイズが不均衡だと不安定になる

「都市圏 8 県 vs 地方 39 県」のように群サイズが極端に偏ると、 F 検定は分散の同等性を強く要求するようになり、仮定の崩れに敏感になります。また Type III 平方和（不均衡 ANOVA で必要）の選択も問題になります。サンプルサイズが揃わない場合は、 Welch の ANOVA、混合モデル、もしくはノンパラメトリック（Kruskal–Wallis）を検討してください。

🐍 Python 実装のバリエーション — scipy / statsmodels / pingouin

① scipy.stats.f_oneway による一元配置 ANOVA

import pandas as pd
from scipy import stats

df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='utf-8-sig')
# 仮の地域分け
df['region'] = df['都道府県'].map(lambda x: '北' if x in ['北海道','青森','秋田','岩手','宮城','山形','福島'] else
                                   '中' if x in ['東京','神奈川','千葉','埼玉','茨城','栃木','群馬','山梨','長野','新潟','富山','石川','福井','静岡'] else
                                   '南' if x in ['愛知','岐阜','三重','大阪','京都','兵庫','奈良','和歌山','滋賀','徳島','香川','愛媛','高知'] else '西')

groups = [g['平均寿命'].dropna().values for _, g in df.groupby('region') if '平均寿命' in df.columns]
F, p = stats.f_oneway(*groups)
print(f'F = {F:.3f}, p = {p:.4f}')

② scipy.stats.f による分散比検定

import numpy as np
from scipy import stats

x1 = df[df['region']=='中']['人口密度'].dropna().values
x2 = df[df['region']=='北']['人口密度'].dropna().values

var1 = np.var(x1, ddof=1)
var2 = np.var(x2, ddof=1)
F = var1 / var2 if var1 > var2 else var2 / var1
df1 = (len(x1) if var1 > var2 else len(x2)) - 1
df2 = (len(x2) if var1 > var2 else len(x1)) - 1

p = 2 * (1 - stats.f.cdf(F, df1, df2))  # 両側
print(f'F = {F:.3f}, df = ({df1}, {df2}), p = {p:.4f}')

③ statsmodels の anova_lm で本格的 ANOVA

import statsmodels.api as sm
from statsmodels.formula.api import ols

model = ols('平均寿命 ~ C(region)', data=df).fit()
anova_table = sm.stats.anova_lm(model, typ=2)
print(anova_table)

④ pingouin で効果量とともに ANOVA

import pingouin as pg

result = pg.anova(data=df, dv='平均寿命', between='region', detailed=True)
print(result)
# 出力：F値、 p値、 partial η² まで自動計算

⑤ Welch の ANOVA（等分散を仮定しない）

import pingouin as pg

result_welch = pg.welch_anova(data=df, dv='平均寿命', between='region')
print(result_welch)

⑥ 多重比較（Tukey HSD）

from statsmodels.stats.multicomp import pairwise_tukeyhsd

tukey = pairwise_tukeyhsd(endog=df['平均寿命'], groups=df['region'], alpha=0.05)
print(tukey.summary())

⑦ Levene 検定（F 検定の頑健な代替）

from scipy import stats

groups = [g['人口密度'].dropna().values for _, g in df.groupby('region')]
stat, p = stats.levene(*groups, center='median')
print(f'Levene W = {stat:.3f}, p = {p:.4f}')
# center='median' は Brown–Forsythe 法。 正規性に頑健。

🔗 関連用語ネットワーク — 前提・並列・発展で 12 項目

📚 前提となる用語

仮説検定 — F 検定は仮説検定の枠組みに位置づけられる。帰無仮説・対立仮説・p 値の概念が前提。
分散 — F 統計量は分散の比。分散の定義と計算が必須。
分布 — F 分布、 χ² 分布、正規分布の理解が必要。
標本分布 — 統計量の分布という考え方を身につけてから F 検定へ。

🤝 並列に学ぶ用語

t 検定 — 平均の差の検定。 2 群なら t 検定、 3 群以上なら ANOVA（F 検定）と棲み分ける。
χ² 検定 — F 分布は χ² の比から派生。兄弟分布として整理。
ANOVA（分散分析） — F 検定の最重要応用。多群の平均差を検定。
信頼区間 — p 値と表裏一体。効果量の信頼区間も併報。

🚀 発展先

MANOVA・多変量分散分析 — 複数の従属変数に対する F 検定の拡張。 Wilks の Λ や Pillai 統計量。
混合効果モデル — 反復測定・階層データに対応。 Satterthwaite 近似 F。
Kruskal–Wallis 検定 — ノンパラメトリック版 ANOVA。正規性が崩れる場合の代替。
多重比較問題 — ANOVA 後の事後検定、偽発見率（FDR）。

📍 あなたが今見ているもの

💡 30秒で分かる結論