ノンパラメトリック検定 (Nonparametric Test)

📍 文脈 💡 30秒結論

📍 あなたが今見ているもの

論文中に 「ノンパラメトリック検定」として登場する用語。

ノンパラメトリック検定 とは：分布の形を仮定しない検定法（順位ベース等）。外れ値や非正規分布データに強い。

💡 30秒で分かる結論

定義：分布の形を仮定しない検定法（順位ベース等）。外れ値や非正規分布データに強い。
カテゴリ：仮説検定

👁️ 直感 — ノンパラメトリック検定は「分布の仮定なし」

ノンパラメトリック検定は、母集団分布について強い仮定をしない検定群。「データが正規分布に従う」必要がない。

使い時

サンプルサイズが小さい（n < 30）
正規性が満たされない
外れ値がある
順序尺度のデータ（厳密な間隔尺度でない）
カテゴリ間で分散が大きく違う

🎯 主要なノンパラ検定

パラメトリック	ノンパラメトリック	用途
1標本 t検定	Wilcoxon符号付き順位	中央値の検定
対応のあるt検定	Wilcoxon符号付き順位	前後比較
独立2標本 t検定	Mann-Whitney U（Wilcoxon順位和）	2群比較
一元配置 ANOVA	Kruskal-Wallis	3群以上比較
反復測定 ANOVA	Friedman 検定	3条件以上
Pearson相関	Spearman, Kendall	順位相関

📐 ノンパラ検定の仕組み

多くのノンパラ検定は、値そのものではなく順位（rank）に基づきます。これにより：

分布の形に依存しない
外れ値の影響を受けにくい
順序尺度のデータでも使える
ただしパラメトリック検定より検出力がやや低い

🐍 Python でのノンパラ検定

▼ コード解説（Mann-Whitney U 検定（2 群の中央値差））

🎯 解説: scipy.stats.mannwhitneyu で 2 群の分布の位置差を検定。 正規性を仮定しない t 検定の代替。

📥 入力例: 都市群 vs 地方群の食料費比率

📤 実行例: U = 521, p = 0.003
  → 中央値が有意に異なる
  都市 22%、 地方 26%

💬 読み方: Mann-Whitney U はランクに基づく検定。 正規性が崩れていても使えるため、 小標本や歪んだ分布で重宝。

from scipy import stats

# Mann-Whitney U（独立2標本）
u, p = stats.mannwhitneyu(group1, group2, alternative='two-sided')

# Wilcoxon 符号付き順位（対応のあるデータ）
w, p = stats.wilcoxon(before, after)

# Kruskal-Wallis（3群以上）
h, p = stats.kruskal(group1, group2, group3)

# Friedman 検定（反復測定）
f, p = stats.friedmanchisquare(cond1, cond2, cond3)

# Spearman 相関
rho, p = stats.spearmanr(x, y)

# Kendall's tau
tau, p = stats.kendalltau(x, y)

🚧 落とし穴と注意点

サンプルサイズを確認（小標本では結果が不安定）
仮定の検証（正規性、独立性、等分散性）
外れ値の影響を散布図で確認
多重比較問題（複数検定時は補正を）
p値だけで判断しない、効果量と信頼区間を併記
因果関係を主張するには別の根拠が必要

🔬 「ノンパラ検定」を深く理解する

パラメトリック vs ノンパラ — 検出力の差

パラメトリック検定は仮定が正しいときに最大の検出力を持つ。仮定が崩れるとノンパラの方が頑健で高い検出力。一般則：

正規分布が成立 → パラメトリックの検出力は約95% vs ノンパラ約86%（Pitman効率）
裾の重い分布 → ノンパラの方が高い検出力

順位検定の歴史

Frank Wilcoxon（1945）：符号付き順位検定、順位和検定を提案
Henry Mann & Donald Whitney（1947）：U検定を独立に発見
Kruskal & Wallis（1952）：多群版を提案
Spearman（1904）、 Kendall（1938）：順位相関

📝 練習問題 — 理解度チェック

この用語の基本定義を、自分の言葉で説明できますか？
この手法が使われる典型的なシナリオを3つ挙げられますか？
この手法の前提条件・仮定を確認できますか？
結果を解釈する際の注意点は何ですか？
類似手法との違いを説明できますか？
Python（または他言語）で実装できますか？
SSDSE データで応用例を作成できますか？

📚 参考文献・さらなる学習

古典的教科書

Casella & Berger "Statistical Inference"
Wasserman "All of Statistics"
Hastie, Tibshirani & Friedman "The Elements of Statistical Learning"
Gelman & Hill "Data Analysis Using Regression and Multilevel/Hierarchical Models"

実践書

VanderPlas "Python Data Science Handbook"
McKinney "Python for Data Analysis"
James, Witten, Hastie & Tibshirani "An Introduction to Statistical Learning"

オンラインリソース

scikit-learn 公式ドキュメント
statsmodels 公式ドキュメント
scipy.stats リファレンス
SSDSE データ（統計データ活用コンペティション）

💼 実務応用ガイド

データサイエンスプロジェクトでの位置づけ

探索的分析（EDA）：基本統計量・可視化でデータを理解
前処理：標準化・正規化・欠損値処理
モデリング：回帰・分類・クラスタリング
評価：CV、指標計算、統計的検定
解釈・報告：効果量・信頼区間・可視化

業界別ユースケース

マーケティング：顧客セグメンテーション、 ROI 分析、 A/Bテスト
金融：ポートフォリオ最適化、リスク評価、信用スコアリング
医療：臨床試験、疫学研究、診断モデル
製造：品質管理、予測保全、工程最適化
公共政策：社会統計、政策効果分析、計画立案

📖 完全ガイド — 統計学習の参照表

分析の流れ — 8ステップ

問題定義：何を知りたいのか、目的を明確に
データ収集：信頼できるソースから（SSDSEなど公的データ）
データクリーニング：欠損値、外れ値、入力ミスの確認
探索的分析（EDA）：要約統計量、ヒストグラム、散布図
変数変換：標準化、対数変換、カテゴリのエンコード
モデリング：適切な手法を選び、学習
評価：CV、指標、統計的検定
解釈・報告：効果量、信頼区間、可視化

統計手法の選び方マトリクス

目的	1変数	2変数	多変量
記述	平均, 中央値, 分散	相関, 共分散	PCA, 因子分析
可視化	ヒストグラム, 箱ひげ	散布図, ヒートマップ	散布図行列, バイプロット
予測	時系列モデル	単回帰	重回帰, Ridge, LASSO
分類	ロジスティック回帰	判別分析	SVM, RF, NN
グループ化	階級分け	2次元クラスタリング	k-means, 階層クラスタリング
検定	1標本t検定	2標本t検定, χ²	ANOVA, MANOVA

サンプル数別の手法ガイド

n	推奨手法
n < 10	記述統計のみ、ノンパラ検定、ベイズ統計
10 ≤ n < 30	t検定, ブートストラップ, 単回帰
30 ≤ n < 200	重回帰, ANOVA, 階層クラスタリング
200 ≤ n < 10000	複雑な回帰, RF, GBM, k-means
n ≥ 10000	深層学習, 大規模分散学習

Python 主要ライブラリ早見表

ライブラリ	用途
numpy	数値計算の基礎、行列演算
pandas	データフレーム、表操作
scipy	統計関数、最適化、線形代数
statsmodels	古典統計、検定、回帰分析の詳細
scikit-learn	機械学習、前処理、評価
matplotlib	基本可視化
seaborn	統計的可視化（高級）
plotly	インタラクティブ可視化
xgboost / lightgbm	勾配ブースティング
PyTorch / TensorFlow	深層学習

よくある質問（FAQ）

Q: 正規分布じゃないデータをどう扱う？
A: 対数変換、 Box-Cox 変換、ノンパラ検定、ブートストラップ
Q: 外れ値を除くべき？
A: ドメイン知識で判断。機械的に除くより、ロバスト手法を検討
Q: サンプルサイズはいくつあれば十分？
A: 効果量と検出力から事前計算（power analysis）
Q: p < 0.05 で「効果あり」と結論していい？
A: 効果量と信頼区間も併記。多重比較補正も
Q: 相関があれば因果がある？
A: ない。 RCT、 IV、 DiD などの因果推論手法が必要

📓 用語のまとめ — 30秒で理解

このページで扱った概念を、学習効率のためにまとめます。これを毎日見ることで、統計の基礎が体に染み込みます。

必ず押さえるべき記号

記号	意味	読み方
μ	母平均	ミュー
σ	母標準偏差	シグマ
σ²	母分散	シグマ二乗
x̄	標本平均	エックスバー
s	標本標準偏差	エス
n	標本サイズ	エヌ
p	p値、比率	ピー
α	有意水準	アルファ
β	回帰係数、第二種誤り率	ベータ
r	相関係数	アール
R²	決定係数	アール二乗
Σ	総和記号、共分散行列	シグマ大文字
N(μ, σ²)	正規分布	ノーマルミューシグマ二乗
t(df)	t分布	ティー
χ²(df)	カイ二乗分布	カイ二乗
F(d1, d2)	F分布	エフ
H₀, H₁	帰無仮説、対立仮説	エイチゼロ、エイチワン
E[X]	期待値	エクスペクタンス
Var(X)	分散	バリアンス
Cov(X, Y)	共分散	カバリアンス

💡 統計学・データサイエンスは「記号の意味を理解する」ことが最初の壁。各記号が何を表すか、公式の中での役割を覚えてしまえば、後はパターンの組合せで様々な手法が理解できます。

🌐 データサイエンス全体像での位置づけ

データサイエンスのワークフロー

ビジネス理解：何を解決したいか
データ理解：どんなデータがあるか
データ準備：前処理、特徴量エンジニアリング
モデリング：手法選択、学習
評価：性能、解釈性、ビジネス価値
展開：実装、運用、監視

(CRISP-DM プロセスより)

主要分野のマッピング

分野	主要技術	代表ツール
記述統計	要約量、可視化	pandas, matplotlib
推測統計	検定、信頼区間	scipy.stats, statsmodels
機械学習	予測、分類、クラスタリング	scikit-learn, XGBoost
深層学習	NN、画像、自然言語	PyTorch, TensorFlow
時系列	ARIMA、状態空間、 LSTM	statsmodels, prophet
因果推論	RCT、 IV、 DiD、 PSM	DoWhy, EconML
ベイズ統計	MCMC、変分推論	PyMC, Stan
最適化	線形/凸/離散最適化	scipy.optimize, cvxpy

キャリアパス

データアナリスト：記述統計、可視化、 BI
データサイエンティスト：機械学習、統計モデリング
機械学習エンジニア：モデル実装、デプロイ、 MLOps
統計学者・計量経済学者：因果推論、統計的検定
研究者：新しい手法開発

💎 良いデータ分析のための10のコツ

必ず可視化から始める：散布図、ヒストグラム、箱ひげ図
外れ値を意識する：除く前にドメイン的に理解
仮定を確認する：正規性、独立性、等分散性
サンプルサイズに見合う複雑性：n=10 で深層学習はしない
効果量も併記する：p値だけでは不十分
信頼区間で不確実性を示す：点推定だけでは誤解の元
多重比較を補正する：探索的解析でも誠実に
ホールドアウト or CV で評価する：訓練データの精度は意味がない
解釈可能性も重視する：ブラックボックスより white-box
再現可能なコードを書く：random_seed、バージョン管理

🔗 用語間の関係 — 統計概念のネットワーク

記述統計の基本セット

これらは互いに深く関連します：

平均：データの重心 → 偏差の合計はゼロ
分散：偏差の二乗の平均 → 平均からの広がり
標準偏差：分散の平方根 → 元の単位
共分散：2変数の偏差の積の平均 → 一緒に動くか
相関係数：共分散を標準偏差で割ったもの → 単位なし

推測統計の基本セット

標準誤差：推定値のばらつき = σ/√n
信頼区間：x̄ ± z × SE
p値：H₀ のもとでの確率
有意水準 α：許容する第一種誤り率
検出力 1-β：差を見つける確率
効果量：差の大きさ（標準化済み）

回帰モデルファミリー

単回帰：1変数 → 1変数の予測
重回帰：多変数 → 1変数
Ridge：L2正則化付き重回帰
LASSO：L1正則化（変数選択付き）
Elastic Net：L1+L2の組合せ
ロジスティック回帰：分類用
ポアソン回帰：カウントデータ用

クラスタリング・次元削減ファミリー

k-means：分割クラスタリング
階層クラスタリング：ツリー構造
Ward法：分散最小化の階層クラスタリング
DBSCAN：密度ベース
PCA：線形次元削減
因子分析：潜在因子モデル
t-SNE, UMAP：非線形次元削減

検定ファミリー

t検定：1〜2 群の平均比較
F検定（ANOVA）：3群以上の平均比較
χ²検定：カテゴリ変数の独立性
Mann-Whitney U：t検定のノンパラ版
Kruskal-Wallis：ANOVAのノンパラ版
Wilcoxon：対応のあるt検定のノンパラ版

🗺️ 概念マップ — 3つの視点で体系を理解する

ノンパラメトリック検定 がデータサイエンスの体系の中でどこに位置するかを、 3つの異なる視点で可視化します。同じ情報でも見方を変えると気付きが変わります。

📍 体系階層のパス

🌐 体系階層に未登録

① 🔗 関係マップ — 「他の手法とどう繋がっているか」

中心の概念から放射状に、前提・兄弟・発展形・応用先などの関係性を矢印で結びます。 横の繋がりを見るのに最適。ノードをドラッグ、ホイールでズーム、クリックで遷移。

凡例：現在の用語上位カテゴリ兄弟（並列）前提発展形応用先2階層先

② ⭕ 包含マップ — 「どのカテゴリに含まれているか」

大きな円が小さな円を包含する Circle Packing 図。 「ノンパラメトリック検定」は緑色でハイライト。

カテゴリ円をクリック：その内部にズームイン
白背景クリック：1階層戻る
用語円をクリック：詳細ページへ遷移
マウスホバー：階層パス表示

📍現在地：統計・データサイエンス

③ 🌳 ツリーマップ — 「面積で見るボリューム比較」

長方形を入れ子に分割した Treemap 図。 各分野の規模感を面積で比較。 「ノンパラメトリック検定」は緑色でハイライト。

カテゴリ矩形をクリック：その内部にドリルダウン
パンくず（上のリンク）クリック：その階層に戻る
用語矩形をクリック：詳細ページへ遷移
マウスホバー：階層パスと値を表示

📍パンくず：統計・データサイエンス

🎯 3つのマップの使い分け

マップ	分かること	こんな時に見る
🔗 関係マップ	手法間の横の関係（前提→発展→応用）	「次に何を学べばよい？」学習順序の判断
⭕ 包含マップ	分類体系の入れ子構造（上位⊃下位）	「この手法はどんなジャンルに属する？」
🌳 ツリーマップ	分野の規模比較（面積=ボリューム）	「データサイエンス全体の俯瞰像」

💡 ジャストインタイム学習のヒント：3つの視点を行き来することで、概念を多角的に理解できます。包含マップやツリーマップはズーム/ドリルダウンで大分類から細部まで探索できます。

🔖 キーワード索引（拡張）

ノンパラメトリック検定の周辺概念をクイックアクセス：

Mann-Whitney U Wilcoxon符号順位 Kruskal-Wallis Friedman 検定符号検定順位和統計量ランク変換タイ（同順位）処理検出力の低下中央値の検定 ≠ 平均の検定 scipy.stats.mannwhitneyu scipy.stats.wilcoxon scikit_posthocs pingouin

🧮 SSDSE-B 実値計算 — 8 地方ブロックの「現金給与」を比較

47都道府県の「現金給与総額」を 8 地方ブロックで Kruskal-Wallis 検定にかけ、ポストホックで Dunn 検定を実施。 t 検定や ANOVA との結果差も観察する。

▼ コード解説（Wilcoxon 符号付き順位検定（対応あり））

🎯 解説: scipy.stats.wilcoxon で対応のある 2 群の差を検定。 paired t 検定のノンパラ版。

📥 入力例: 同じ県の 2019 と 2023 の死亡率

📤 実行例: W = 124, p < 0.001
  → 2023 の方が高い

💬 読み方: 対応サンプル（同じ県の 2 時点）には Wilcoxon。 正規性が必要な paired t より頑健。

▼ コード解説（Kruskal-Wallis 検定（3 群以上））

🎯 解説: scipy.stats.kruskal で 3 群以上の中央値差を検定。 one-way ANOVA のノンパラ版。

📥 入力例: 8 地域ブロック × 高齢化率

📤 実行例: H = 35.8, df=7, p<0.001
  → 地域間で分布が異なる

💬 読み方: Kruskal-Wallis は地域比較に頻出。 ANOVA より正規性に頑健で、 多群比較の標準的選択肢。

import pandas as pd
from scipy import stats

df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='cp932', header=1)
df.columns = [c.strip() for c in df.columns]

def region(code):
    code = int(code)
    if code == 1:                  return '北海道'
    if 2  <= code <= 7:            return '東北'
    if 8  <= code <= 14:           return '関東'
    if 15 <= code <= 23:           return '中部'
    if 24 <= code <= 30:           return '近畿'
    if 31 <= code <= 35:           return '中国'
    if 36 <= code <= 39:           return '四国'
    return '九州沖縄'
df['region'] = df['地域コード'].apply(region)

groups = [df.loc[df['region']==r, '現金給与総額'].values
          for r in df['region'].unique()]

H, p_kw = stats.kruskal(*groups)
F, p_aov = stats.f_oneway(*groups)
print(f'Kruskal-Wallis : H = {H:.2f}, p = {p_kw:.4f}')
print(f'One-way ANOVA  : F = {F:.2f}, p = {p_aov:.4f}')

典型的な出力例： H ≈ 16.2, p_kw ≈ 0.024、 F ≈ 2.8, p_aov ≈ 0.020。どちらも有意（5%水準）で、結論は一致する。 SSDSE-B のように 47 都道府県 × 8 群＝群あたり 5〜10 のサンプルでは、正規性が怪しいので Kruskal-Wallis の方を主結果に採用するのが無難。

ポストホック：Mann-Whitney U で 2 群ずつ比較（Bonferroni 補正）

▼ コード解説（Friedman 検定（対応 3 群以上））

🎯 解説: scipy.stats.friedmanchisquare で対応 3 群以上の差を検定。 反復測定 ANOVA のノンパラ版。

📥 入力例: 47 県 × 5 年の死亡率

📤 実行例: Q = 86.3, df=4, p<0.001
  → 年度間で異なる

💬 読み方: パネルデータの年度間比較に有効。 各県を「ブロック」として扱い、 年度を「処理」とみなす。

▼ コード解説（Spearman 順位相関）

🎯 解説: scipy.stats.spearmanr で順位相関を計算。 単調関係（線形でなくても）を検出。

📥 入力例: df['高齢化率'] と df['死亡率']

📤 実行例: ρ = 0.968, p<0.001
  → 強い単調関係
  Pearson r=0.97 とほぼ同じ

💬 読み方: Spearman は単調関係（曲線でも単調なら OK）を検出。 外れ値に強く、 Pearson との比較で関係の形を診断できる。

from itertools import combinations
regions = df['region'].unique()
k = len(regions)
m = k*(k-1)//2          # 比較数
print(f'比較数 = {m}, Bonferroni 補正後の α = {0.05/m:.4f}')
for r1, r2 in combinations(regions, 2):
    a = df.loc[df.region==r1, '現金給与総額']
    b = df.loc[df.region==r2, '現金給与総額']
    U, p = stats.mannwhitneyu(a, b, alternative='two-sided')
    mark = '*' if p < 0.05/m else ' '
    print(f'{mark} {r1:<5s} vs {r2:<5s}  U={U:6.1f}  p={p:.4f}')

scikit_posthocs で Dunn 検定（Holm 補正）

▼ コード解説（Kendall's τ）

🎯 解説: scipy.stats.kendalltau で Kendall の τ を計算。 順位相関の別バージョンで、 小標本で安定。

📥 入力例: 高齢化率と死亡率

📤 実行例: τ = 0.85, p<0.001
  → 一致順位多い

💬 読み方: Kendall τ は n<30 で Spearman より安定。 ペアの一致/不一致をカウントする直感的な指標。

▼ コード解説（Bootstrap CI（中央値の信頼区間））

🎯 解説: scipy.stats.bootstrap で中央値の 95% CI を計算。 分布仮定を置かない頑健な区間推定。

📥 入力例: 死亡率の中央値、 n_resamples=10000

📤 実行例: 中央値 = 12.3
  95% CI: [11.5, 13.1]

💬 読み方: ブートストラップは分布によらず信頼区間を構成。 中央値・四分位数など平均以外の統計量にも対応。

import scikit_posthocs as sp
pvals = sp.posthoc_dunn(df, val_col='現金給与総額',
                        group_col='region', p_adjust='holm')
print(pvals.round(3))

⚠️ ノンパラメトリック検定の落とし穴 — 6 つの典型ミス

① 「ノンパラ＝中央値の検定」と誤解する

Mann-Whitney U や Kruskal-Wallis は、厳密には「中央値の検定」ではなく「分布が確率的に大きいか小さいか（stochastic dominance）」を検定している。分布の形が大きく違う（一方が右に裾を引く等）と、中央値が等しくても有意になりうる。厳密に「中央値の差」を検定したいなら Brown-Mood 中央値検定や、 Hodges-Lehmann 推定量に基づく信頼区間を用いる。教科書通りに「中央値の比較」と書いて投稿査読で指摘されることが多い。

② 正規性が成り立つのにノンパラを使い検出力を失う

「外れ値が怖いから何でもノンパラ」というのは過剰な保守。母集団が概ね正規ならパラメトリック検定（t 検定）の方が漸近相対効率（ARE）で常に高く、 Mann-Whitney U の ARE は正規下で 3/π ≈ 0.955 にしかならない。つまり同じ検出力を得るのに 5% 多くサンプルが必要。まず正規性プロット（Q-Q）・Shapiro 検定で確認し、明らかに正規でない場合のみノンパラに切り替える、という順序が標準。

③ タイ（同順位）が多いのに正規近似 p 値で済ます

順序データやカウントデータでは同値が頻発し、 Mann-Whitney U の正規近似 p 値が不正確になる。タイが多い場合は (a) タイ補正済み分散を使う、 (b) 厳密 p 値（exact mode）を計算する、 (c) 並べ替え検定で代替する、のいずれかを選ぶ。 scipy.stats.mannwhitneyu は method='exact' でタイがあると警告を出す。 N が大きく exact が計算困難なら permutation test に切り替える。

④ 多重比較補正なしでポストホックを乱発する

Kruskal-Wallis で有意になったあと、ペアワイズ Mann-Whitney U を 28 ペア（8 群）打って、補正なしで「ここが有意！」と報告する事故が多い。これでは family-wise error rate が α = 1 - (1-0.05)^28 ≈ 76% にまで膨らむ。 Bonferroni（保守的）、 Holm（手堅い）、 Benjamini-Hochberg（FDR）のいずれかを必ず適用。 scikit_posthocs.posthoc_dunn は p_adjust 引数で指定可能。

⑤ 効果量を報告しない

p 値だけ書いて効果量を出さないのは現代統計の悪習。 Mann-Whitney U なら r = Z/√N、 rank-biserial 相関 r_rb、もしくは Cliff's δ を報告するのが標準。 Wilcoxon 符号順位なら r = Z/√N、もしくは Hedges' g に変換。サンプルが少ない時は信頼区間（ブートストラップ）を併記すると説得力が増す。査読者は p 値より効果量と CI を重視する傾向が強い。

⑥ Wilcoxon 符号順位検定で対称性仮定を忘れる

Wilcoxon signed-rank test は「差の分布が中央値ゼロを中心に対称」という仮定を置く。対称性が崩れる（強く歪んだ差分分布）と、検定の解釈は「中央値ゼロ」ではなく「分布のシフト」になる。対称性が怪しい場合は符号検定（sign test、差の符号だけを見る）の方が頑健だが、検出力は落ちる。ヒストグラムと QQ プロットで対称性を必ず確認すること。

🐍 Python 実装バリエーション — scipy / pingouin / scikit_posthocs

1. scipy.stats — 主要 5 検定の最短コード

▼ コード解説（Permutation test（順列検定））

🎯 解説: scipy.stats.permutation_test で 2 群差を順列検定。 帰無仮説のもとで全並び替えを試す厳密検定。

📥 入力例: 都市 vs 地方の食料費比率、 n_resamples=10000

📤 実行例: 観測差 = 4.2%
  順列差の 95% range: [-2.1, 2.0]
  p < 0.001

💬 読み方: 順列検定は仮定が最小限。 計算負荷は高いが小標本では最も信頼できる。

▼ コード解説（Kolmogorov-Smirnov 検定）

🎯 解説: scipy.stats.kstest または ks_2samp で 2 分布の差を検定。 累積分布関数の最大乖離を測定。

📥 入力例: 都市群と地方群の食料費比率分布

📤 実行例: D = 0.62, p = 0.002
  → 分布全体が異なる

💬 読み方: K-S 検定は「中央値だけでなく分布形状」を検査。 中央値が同じでも分散・歪みが違えば棄却される。

from scipy import stats
# 2 群独立：Mann-Whitney U
U, p = stats.mannwhitneyu(a, b, alternative='two-sided', method='auto')
# 2 群対応：Wilcoxon 符号順位
W, p = stats.wilcoxon(x, y, zero_method='wilcox', correction=True)
# k 群独立：Kruskal-Wallis
H, p = stats.kruskal(g1, g2, g3, g4)
# k 群対応：Friedman
chi2, p = stats.friedmanchisquare(*data_per_condition)
# 符号検定（scipy 1.10+）
res = stats.binomtest(np.sum(diff > 0), n=np.sum(diff != 0), p=0.5)

2. pingouin — 高機能で効果量も自動

▼ コード解説（符号検定（最も基礎））

🎯 解説: 対応サンプルで「差が正/負か」のみを使う検定。 中央値の検定に対応。

📥 入力例: 2019 と 2023 の死亡率の差の符号

📤 実行例: 正の差 38 県、 負の差 9 県
  二項検定 p<0.001

💬 読み方: 符号検定は最もシンプル。 ノンパラの中でも仮定が最小限で、 中央値の差を粗く検出するのに使う。

▼ コード解説（Boxplot で群間比較）

🎯 解説: seaborn.boxplot で群別に箱ひげ図を描画。 中央値・四分位数・外れ値を視覚化。

📥 入力例: x='地域ブロック', y='死亡率'

📤 実行例: nonparam_boxplot.png
  地域ブロック別の中央値・分布形状

💬 読み方: Boxplot はノンパラ検定の結果を視覚化する標準ツール。 中央値や IQR の差が一目で分かる。

import pingouin as pg
# Mann-Whitney + 効果量 r + CI
print(pg.mwu(a, b))
# Kruskal-Wallis + η²
print(pg.kruskal(data=df, dv='現金給与総額', between='region'))
# Wilcoxon + 効果量
print(pg.wilcoxon(x, y))

3. scikit_posthocs — Kruskal 後のペアワイズ Dunn / Conover

▼ コード解説（Rank ベースのモデリング）

🎯 解説: 応答変数をランクに変換してから OLS。 ノンパラ回帰の簡易版。

📥 入力例: y_rank = scipy.stats.rankdata(y)
  X_rank も同様

📤 実行例: Rank R² ≈ 0.92（ほぼ同じ）
  外れ値の影響を吸収

💬 読み方: ランク変換すると外れ値の影響が消える。 ロバスト回帰の簡易代替として有効。

▼ コード解説（Effect size（ノンパラ））

🎯 解説: Cliff's delta や Common Language Effect Size で 2 群差の効果量を計算。

📥 入力例: 都市と地方の食料費比率

📤 実行例: Cliff's δ = 0.62（大効果）
  CLES = 0.81（都市の方が低い確率）

💬 読み方: p 値だけでなく効果量も報告するのが現代統計の標準。 Cliff's δ は -1〜1 の範囲で直感的。

import scikit_posthocs as sp
sp.posthoc_dunn(df, val_col='y', group_col='g', p_adjust='holm')
sp.posthoc_conover(df, val_col='y', group_col='g', p_adjust='fdr_bh')
sp.posthoc_nemenyi_friedman(data_matrix)

4. statsmodels で並べ替え検定（permutation test）

▼ コード解説（nonparametric の Python 実装（コードブロック 14））

🎯 解説: nonparametric を SSDSE-B-2026 都道府県データで実行する Python コード。 47 都道府県 × 112 指標のパネルデータを使い、 公的統計の実値に基づいて手法を可視化する。 教育用ハンズオン教材として scipy/pandas/sklearn の標準ライブラリで完結。

📥 入力例: data/raw/SSDSE-B-2026.csv
  encoding=shift_jis（または cp932）, skiprows=1
  47 都道府県 × 5 年（2019-2023）= 235 行
  数値特徴量 100+ 列（家計・人口・教育・医療）

📤 実行例: nonparametric の主要出力を確認
  都道府県別・年度別の指標が出力される
  例: 秋田・沖縄・東京の差異が顕著に表れる
  プロット・統計量・モデルパラメータ等の結果を取得

💬 読み方: nonparametric の結果は SSDSE-B-2026 の地域特性を反映。 都市圏／地方圏／観光圏でパターンが異なり、 47 県の異質性を視覚化・定量化できる。 統計データ活用コンペの実分析に直接転用可能。

▼ コード解説（nonparametric の Python 実装（コードブロック 15））

🎯 解説: nonparametric を SSDSE-B-2026 都道府県データで実行する Python コード。 47 都道府県 × 112 指標のパネルデータを使い、 公的統計の実値に基づいて手法を可視化する。 教育用ハンズオン教材として scipy/pandas/sklearn の標準ライブラリで完結。

📥 入力例: data/raw/SSDSE-B-2026.csv
  encoding=shift_jis（または cp932）, skiprows=1
  47 都道府県 × 5 年（2019-2023）= 235 行
  数値特徴量 100+ 列（家計・人口・教育・医療）

📤 実行例: nonparametric の主要出力を確認
  都道府県別・年度別の指標が出力される
  例: 秋田・沖縄・東京の差異が顕著に表れる
  プロット・統計量・モデルパラメータ等の結果を取得

💬 読み方: nonparametric の結果は SSDSE-B-2026 の地域特性を反映。 都市圏／地方圏／観光圏でパターンが異なり、 47 県の異質性を視覚化・定量化できる。 統計データ活用コンペの実分析に直接転用可能。

from scipy.stats import permutation_test
def diff_median(x, y, axis=0):
    return np.median(x, axis=axis) - np.median(y, axis=axis)

res = permutation_test((a, b), diff_median, n_resamples=20000,
                       alternative='two-sided', random_state=0)
print(f'observed diff = {res.statistic:.3f}, p = {res.pvalue:.4f}')

5. 効果量と信頼区間をブートストラップで

▼ コード解説（nonparametric の Python 実装（コードブロック 16））

🎯 解説: nonparametric を SSDSE-B-2026 都道府県データで実行する Python コード。 47 都道府県 × 112 指標のパネルデータを使い、 公的統計の実値に基づいて手法を可視化する。 教育用ハンズオン教材として scipy/pandas/sklearn の標準ライブラリで完結。

📥 入力例: data/raw/SSDSE-B-2026.csv
  encoding=shift_jis（または cp932）, skiprows=1
  47 都道府県 × 5 年（2019-2023）= 235 行
  数値特徴量 100+ 列（家計・人口・教育・医療）

📤 実行例: nonparametric の主要出力を確認
  都道府県別・年度別の指標が出力される
  例: 秋田・沖縄・東京の差異が顕著に表れる
  プロット・統計量・モデルパラメータ等の結果を取得

💬 読み方: nonparametric の結果は SSDSE-B-2026 の地域特性を反映。 都市圏／地方圏／観光圏でパターンが異なり、 47 県の異質性を視覚化・定量化できる。 統計データ活用コンペの実分析に直接転用可能。

▼ コード解説（nonparametric の Python 実装（コードブロック 17））

🎯 解説: nonparametric を SSDSE-B-2026 都道府県データで実行する Python コード。 47 都道府県 × 112 指標のパネルデータを使い、 公的統計の実値に基づいて手法を可視化する。 教育用ハンズオン教材として scipy/pandas/sklearn の標準ライブラリで完結。

📥 入力例: data/raw/SSDSE-B-2026.csv
  encoding=shift_jis（または cp932）, skiprows=1
  47 都道府県 × 5 年（2019-2023）= 235 行
  数値特徴量 100+ 列（家計・人口・教育・医療）

📤 実行例: nonparametric の主要出力を確認
  都道府県別・年度別の指標が出力される
  例: 秋田・沖縄・東京の差異が顕著に表れる
  プロット・統計量・モデルパラメータ等の結果を取得

💬 読み方: nonparametric の結果は SSDSE-B-2026 の地域特性を反映。 都市圏／地方圏／観光圏でパターンが異なり、 47 県の異質性を視覚化・定量化できる。 統計データ活用コンペの実分析に直接転用可能。

from scipy.stats import bootstrap
import numpy as np

def cliffs_delta(x, y):
    n = len(x) * len(y)
    return (np.sum(x[:,None] > y[None,:]) - np.sum(x[:,None] < y[None,:])) / n

res = bootstrap((a, b), cliffs_delta, paired=False,
                n_resamples=5000, confidence_level=0.95)
print('Cliffs δ 95% CI =', res.confidence_interval)

場面	使い方
探索的データ分析	分布や関係性の最初の確認
モデル比較	仮定の妥当性を裏付ける指標として
レポート作成	標準的な要約統計量・指標として明記

項目	値・指標
データ件数	47 都道府県
対象指標	人口・世帯数・就業者数など
計算結果	上記説明参照

📍 あなたが今見ているもの

💡 30秒で分かる結論

👁️ 直感 — ノンパラメトリック検定は「分布の仮定なし」

使い時

🎯 主要なノンパラ検定

📐 ノンパラ検定の仕組み

🐍 Python でのノンパラ検定

🚧 落とし穴と注意点

🔬 「ノンパラ検定」を深く理解する

パラメトリック vs ノンパラ — 検出力の差

順位検定の歴史

📝 練習問題 — 理解度チェック

🔗 さらに学ぶための関連用語

📚 参考文献・さらなる学習

古典的教科書

実践書

オンラインリソース

💼 実務応用ガイド

データサイエンスプロジェクトでの位置づけ

業界別ユースケース

📖 完全ガイド — 統計学習の参照表

分析の流れ — 8ステップ

統計手法の選び方マトリクス

サンプル数別の手法ガイド

Python 主要ライブラリ早見表

よくある質問（FAQ）

📓 用語のまとめ — 30秒で理解

必ず押さえるべき記号

🌐 データサイエンス全体像での位置づけ

データサイエンスのワークフロー

主要分野のマッピング

キャリアパス

💎 良いデータ分析のための10のコツ

🔗 用語間の関係 — 統計概念のネットワーク

記述統計の基本セット

推測統計の基本セット

回帰モデルファミリー

クラスタリング・次元削減ファミリー

検定ファミリー

🗺️ 概念マップ — 3つの視点で体系を理解する

📍 体系階層のパス

① 🔗 関係マップ — 「他の手法とどう繋がっているか」

② ⭕ 包含マップ — 「どのカテゴリに含まれているか」

③ 🌳 ツリーマップ — 「面積で見るボリューム比較」

🎯 3つのマップの使い分け

🔖 キーワード索引（拡張）

🧮 SSDSE-B 実値計算 — 8 地方ブロックの「現金給与」を比較

ポストホック：Mann-Whitney U で 2 群ずつ比較（Bonferroni 補正）

scikit_posthocs で Dunn 検定（Holm 補正）

⚠️ ノンパラメトリック検定の落とし穴 — 6 つの典型ミス

① 「ノンパラ＝中央値の検定」と誤解する

② 正規性が成り立つのにノンパラを使い検出力を失う

③ タイ（同順位）が多いのに正規近似 p 値で済ます

④ 多重比較補正なしでポストホックを乱発する

⑤ 効果量を報告しない

⑥ Wilcoxon 符号順位検定で対称性仮定を忘れる

🐍 Python 実装バリエーション — scipy / pingouin / scikit_posthocs

1. scipy.stats — 主要 5 検定の最短コード

2. pingouin — 高機能で効果量も自動

3. scikit_posthocs — Kruskal 後のペアワイズ Dunn / Conover

4. statsmodels で並べ替え検定（permutation test）

5. 効果量と信頼区間をブートストラップで

🔗 関連用語（拡張ネットワーク）

📚 前提となる用語

🔀 並列に学ぶ用語

🚀 発展先の用語

🧰 ツール・周辺概念

🔖 キーワード索引

💡 30秒で分かる結論

📍 あなたが今見ているもの（文脈ボックス）

🎨 直感で掴む

📐 数式または定義

🔬 数式を言葉で読み解く

🧮 実値で計算してみる（SSDSE-B-2026）

🐍 Python 実装

⚠️ 落とし穴

🌐 関連手法・派生

🔗 関連用語（前提・並列・発展）

前提となる概念

並列・類似の概念