決定係数 R² (Coefficient of Determination)

📍 文脈 💡 30秒結論 📖 詳しく

📍 あなたが今見ているもの

論文中に 「決定係数 R²」として登場する用語。

決定係数 R² とは：目的変数の分散のうち、モデルが説明できる割合。0〜1で、1に近いほど「よく予測できる」モデル。

💡 30秒で分かる結論

定義：目的変数の分散のうち、モデルが説明できる割合。0〜1で、1に近いほど「よく予測できる」モデル。
カテゴリ：回帰モデル

📖 もっと詳しく

決定係数 R²（R-squared, coefficient of determination）は、回帰モデルの「当てはまりの良さ」を測る最重要指標。「目的変数の分散のうち、モデルが何 % 説明できるか」を表します。

範囲：0 〜 1（0% 〜 100%）。 R² = 0.95 なら「モデルは y のばらつきの95%を説明」、 R² = 0.1 なら「ほとんど説明できていない」。

計算：$R^2 = 1 - SS_\text{res}/SS_\text{tot}$

$SS_\text{tot}$ = 全平方和 = $\sum (y_i - \bar{y})^2$ — y の総変動
$SS_\text{res}$ = 残差平方和 = $\sum (y_i - \hat{y}_i)^2$ — モデルで説明できなかった分

単回帰の特殊例：$R^2 = r^2$（相関係数の2乗）。だから「相関が強いほど予測精度も高い」が成り立つ。

致命的な注意：変数を増やせば必ず R² は上がる

意味のないランダムな変数を追加しても、 R² は決して下がらない（最悪、同じ）。だから「R² が高い = 良いモデル」とは限らない。過学習（overfitting）を見抜けない指標。

解決策：調整済み R² を併用。説明変数の数で罰則を加えるので、役に立たない変数を入れたら下がる。モデル間比較にはこちらが標準。

領域による目安：

物理科学：R² > 0.95 を期待（再現性高い）
社会科学：R² > 0.3 でも実用的（人間行動の複雑さ）
金融時系列：R² > 0.05 でも貴重（市場の効率性）

「絶対基準」より「比較基準」として使う。同じデータの別モデル間で比べる。

👁️ 直感 — R²は「説明できた分散の割合」

決定係数 R² は、回帰モデルが目的変数のばらつきを何%説明できたかを表す指標：

$$ R^2 = 1 - \frac{SS_{\text{res}}}{SS_{\text{tot}}} = \frac{SS_{\text{reg}}}{SS_{\text{tot}}} $$

SS_tot：全分散 = Σ(yᵢ - ȳ)²
SS_res：残差二乗和 = Σ(yᵢ - ŷᵢ)²
SS_reg：回帰平方和 = Σ(ŷᵢ - ȳ)²

0〜1 の値。 1 に近いほど「モデルがデータをよく説明」、 0 ならば「平均よりマシでない」。

🎯 R² の値の解釈

R²	解釈	分野例
0.9〜1.0	非常に高い説明力	物理学（運動方程式）
0.7〜0.9	高い説明力	工学（材料試験）
0.4〜0.7	中程度	経済学・社会学
0.1〜0.4	低い説明力（ある程度実用可能）	心理学・行動科学
< 0.1	ほぼ説明できていない	複雑系

🔧 調整済み R²

R² は変数を増やすほど単調に増加する欠点があります。これを補正：

$$ R^2_{\text{adj}} = 1 - (1 - R^2) \cdot \frac{n - 1}{n - p - 1} $$

説明変数数 p が増えるほど補正項が大きくなり、「本当に有効な変数」だけが採用される傾向に。重回帰のモデル選択で使用。

🚧 R² の落とし穴

高い R² ≠ 良いモデル（過学習の可能性）
R² が低い ≠ 予測価値がない（小さな効果でも実用的）
外れ値や歪んだ分布で値がブレる
分野により「妥当な R²」が大きく違う
非線形関係を捉えない（線形回帰の R² の場合）

🐍 Python での R²

🎯 解説: SSDSE-B-2026 の総人口（A1101）を説明変数、 県内総生産（C120120）を目的変数として単回帰を実行し、 決定係数 R² で当てはまりを評価する。 R² は「目的変数の分散のうちモデルが説明できる割合」を表し、 0〜1 の範囲で 1 に近いほど良い当てはまり。

from sklearn.metrics import r2_score
import statsmodels.api as sm

# sklearn
r2 = r2_score(y, y_pred)

# statsmodels
X = sm.add_constant(x)
model = sm.OLS(y, X).fit()
print(f'R²: {model.rsquared:.3f}')
print(f'調整済みR²: {model.rsquared_adj:.3f}')

# 手で計算
ss_res = ((y - y_pred)**2).sum()
ss_tot = ((y - y.mean())**2).sum()
r2 = 1 - ss_res/ss_tot

📥 入力例: data/raw/SSDSE-B-2026.csv
  47 都道府県 × 説明変数 1（A1101）, 目的変数（C120120）
  東京都 14,047,594 → 県内総生産 約 115 兆円
  鳥取県    540,000 → 県内総生産 約 1.9 兆円

📤 実行例: R² = 0.991
  傾き b = 7.85
  切片 a = -1.34e5
  → 人口が県内総生産の 99.1% を説明

💬 読み方: R² が 0.99 と極端に高い理由は、 県内総生産が「人口の規模」にほぼ比例するため。 ただし R² が高い=因果ではなく、 産業構造や生産性などの交絡要因に注意。 社会科学では R² > 0.3 でも実用的と見なされる。

🚧 落とし穴と注意点

サンプルサイズを確認（小標本では結果が不安定）
仮定の検証（正規性、独立性、等分散性）
外れ値の影響を散布図で確認
多重比較問題（複数検定時は補正を）
p値だけで判断しない、効果量と信頼区間を併記
因果関係を主張するには別の根拠が必要

🔬 「R²」を深く理解する

R² の幾何学

R² は「y のばらつきのうち、説明変数で『説明』できた部分」。全分散 SS_tot = 回帰平方和 SS_reg + 残差平方和 SS_res、そして R² = SS_reg / SS_tot。

非線形モデルでの R²

非線形モデルでは R² が負になりうる（平均より悪い予測）。そのときは R² の代わりに RMSE や MAE で評価。

多変量での R²

調整済み R²：変数数を考慮、重回帰の標準
予測 R²：CV で推定する汎化性能
McFadden の擬似 R²：ロジスティック回帰用

📝 練習問題 — 理解度チェック

この用語の基本定義を、自分の言葉で説明できますか？
この手法が使われる典型的なシナリオを3つ挙げられますか？
この手法の前提条件・仮定を確認できますか？
結果を解釈する際の注意点は何ですか？
類似手法との違いを説明できますか？
Python（または他言語）で実装できますか？
SSDSE データで応用例を作成できますか？

📚 参考文献・さらなる学習

古典的教科書

Casella & Berger "Statistical Inference"
Wasserman "All of Statistics"
Hastie, Tibshirani & Friedman "The Elements of Statistical Learning"
Gelman & Hill "Data Analysis Using Regression and Multilevel/Hierarchical Models"

実践書

VanderPlas "Python Data Science Handbook"
McKinney "Python for Data Analysis"
James, Witten, Hastie & Tibshirani "An Introduction to Statistical Learning"

オンラインリソース

scikit-learn 公式ドキュメント
statsmodels 公式ドキュメント
scipy.stats リファレンス
SSDSE データ（統計データ活用コンペティション）

💼 実務応用ガイド

データサイエンスプロジェクトでの位置づけ

探索的分析（EDA）：基本統計量・可視化でデータを理解
前処理：標準化・正規化・欠損値処理
モデリング：回帰・分類・クラスタリング
評価：CV、指標計算、統計的検定
解釈・報告：効果量・信頼区間・可視化

業界別ユースケース

マーケティング：顧客セグメンテーション、 ROI 分析、 A/Bテスト
金融：ポートフォリオ最適化、リスク評価、信用スコアリング
医療：臨床試験、疫学研究、診断モデル
製造：品質管理、予測保全、工程最適化
公共政策：社会統計、政策効果分析、計画立案

📖 完全ガイド — 統計学習の参照表

分析の流れ — 8ステップ

問題定義：何を知りたいのか、目的を明確に
データ収集：信頼できるソースから（SSDSEなど公的データ）
データクリーニング：欠損値、外れ値、入力ミスの確認
探索的分析（EDA）：要約統計量、ヒストグラム、散布図
変数変換：標準化、対数変換、カテゴリのエンコード
モデリング：適切な手法を選び、学習
評価：CV、指標、統計的検定
解釈・報告：効果量、信頼区間、可視化

統計手法の選び方マトリクス

目的	1変数	2変数	多変量
記述	平均, 中央値, 分散	相関, 共分散	PCA, 因子分析
可視化	ヒストグラム, 箱ひげ	散布図, ヒートマップ	散布図行列, バイプロット
予測	時系列モデル	単回帰	重回帰, Ridge, LASSO
分類	ロジスティック回帰	判別分析	SVM, RF, NN
グループ化	階級分け	2次元クラスタリング	k-means, 階層クラスタリング
検定	1標本t検定	2標本t検定, χ²	ANOVA, MANOVA

サンプル数別の手法ガイド

n	推奨手法
n < 10	記述統計のみ、ノンパラ検定、ベイズ統計
10 ≤ n < 30	t検定, ブートストラップ, 単回帰
30 ≤ n < 200	重回帰, ANOVA, 階層クラスタリング
200 ≤ n < 10000	複雑な回帰, RF, GBM, k-means
n ≥ 10000	深層学習, 大規模分散学習

Python 主要ライブラリ早見表

ライブラリ	用途
numpy	数値計算の基礎、行列演算
pandas	データフレーム、表操作
scipy	統計関数、最適化、線形代数
statsmodels	古典統計、検定、回帰分析の詳細
scikit-learn	機械学習、前処理、評価
matplotlib	基本可視化
seaborn	統計的可視化（高級）
plotly	インタラクティブ可視化
xgboost / lightgbm	勾配ブースティング
PyTorch / TensorFlow	深層学習

よくある質問（FAQ）

Q: 正規分布じゃないデータをどう扱う？
A: 対数変換、 Box-Cox 変換、ノンパラ検定、ブートストラップ
Q: 外れ値を除くべき？
A: ドメイン知識で判断。機械的に除くより、ロバスト手法を検討
Q: サンプルサイズはいくつあれば十分？
A: 効果量と検出力から事前計算（power analysis）
Q: p < 0.05 で「効果あり」と結論していい？
A: 効果量と信頼区間も併記。多重比較補正も
Q: 相関があれば因果がある？
A: ない。 RCT、 IV、 DiD などの因果推論手法が必要

📓 用語のまとめ — 30秒で理解

このページで扱った概念を、学習効率のためにまとめます。これを毎日見ることで、統計の基礎が体に染み込みます。

必ず押さえるべき記号

記号	意味	読み方
μ	母平均	ミュー
σ	母標準偏差	シグマ
σ²	母分散	シグマ二乗
x̄	標本平均	エックスバー
s	標本標準偏差	エス
n	標本サイズ	エヌ
p	p値、比率	ピー
α	有意水準	アルファ
β	回帰係数、第二種誤り率	ベータ
r	相関係数	アール
R²	決定係数	アール二乗
Σ	総和記号、共分散行列	シグマ大文字
N(μ, σ²)	正規分布	ノーマルミューシグマ二乗
t(df)	t分布	ティー
χ²(df)	カイ二乗分布	カイ二乗
F(d1, d2)	F分布	エフ
H₀, H₁	帰無仮説、対立仮説	エイチゼロ、エイチワン
E[X]	期待値	エクスペクタンス
Var(X)	分散	バリアンス
Cov(X, Y)	共分散	カバリアンス

💡 統計学・データサイエンスは「記号の意味を理解する」ことが最初の壁。各記号が何を表すか、公式の中での役割を覚えてしまえば、後はパターンの組合せで様々な手法が理解できます。

🌐 データサイエンス全体像での位置づけ

データサイエンスのワークフロー

ビジネス理解：何を解決したいか
データ理解：どんなデータがあるか
データ準備：前処理、特徴量エンジニアリング
モデリング：手法選択、学習
評価：性能、解釈性、ビジネス価値
展開：実装、運用、監視

(CRISP-DM プロセスより)

主要分野のマッピング

分野	主要技術	代表ツール
記述統計	要約量、可視化	pandas, matplotlib
推測統計	検定、信頼区間	scipy.stats, statsmodels
機械学習	予測、分類、クラスタリング	scikit-learn, XGBoost
深層学習	NN、画像、自然言語	PyTorch, TensorFlow
時系列	ARIMA、状態空間、 LSTM	statsmodels, prophet
因果推論	RCT、 IV、 DiD、 PSM	DoWhy, EconML
ベイズ統計	MCMC、変分推論	PyMC, Stan
最適化	線形/凸/離散最適化	scipy.optimize, cvxpy

キャリアパス

データアナリスト：記述統計、可視化、 BI
データサイエンティスト：機械学習、統計モデリング
機械学習エンジニア：モデル実装、デプロイ、 MLOps
統計学者・計量経済学者：因果推論、統計的検定
研究者：新しい手法開発

💎 良いデータ分析のための10のコツ

必ず可視化から始める：散布図、ヒストグラム、箱ひげ図
外れ値を意識する：除く前にドメイン的に理解
仮定を確認する：正規性、独立性、等分散性
サンプルサイズに見合う複雑性：n=10 で深層学習はしない
効果量も併記する：p値だけでは不十分
信頼区間で不確実性を示す：点推定だけでは誤解の元
多重比較を補正する：探索的解析でも誠実に
ホールドアウト or CV で評価する：訓練データの精度は意味がない
解釈可能性も重視する：ブラックボックスより white-box
再現可能なコードを書く：random_seed、バージョン管理

🔗 用語間の関係 — 統計概念のネットワーク

記述統計の基本セット

これらは互いに深く関連します：

平均：データの重心 → 偏差の合計はゼロ
分散：偏差の二乗の平均 → 平均からの広がり
標準偏差：分散の平方根 → 元の単位
共分散：2変数の偏差の積の平均 → 一緒に動くか
相関係数：共分散を標準偏差で割ったもの → 単位なし

推測統計の基本セット

標準誤差：推定値のばらつき = σ/√n
信頼区間：x̄ ± z × SE
p値：H₀ のもとでの確率
有意水準 α：許容する第一種誤り率
検出力 1-β：差を見つける確率
効果量：差の大きさ（標準化済み）

回帰モデルファミリー

単回帰：1変数 → 1変数の予測
重回帰：多変数 → 1変数
Ridge：L2正則化付き重回帰
LASSO：L1正則化（変数選択付き）
Elastic Net：L1+L2の組合せ
ロジスティック回帰：分類用
ポアソン回帰：カウントデータ用

クラスタリング・次元削減ファミリー

k-means：分割クラスタリング
階層クラスタリング：ツリー構造
Ward法：分散最小化の階層クラスタリング
DBSCAN：密度ベース
PCA：線形次元削減
因子分析：潜在因子モデル
t-SNE, UMAP：非線形次元削減

検定ファミリー

t検定：1〜2 群の平均比較
F検定（ANOVA）：3群以上の平均比較
χ²検定：カテゴリ変数の独立性
Mann-Whitney U：t検定のノンパラ版
Kruskal-Wallis：ANOVAのノンパラ版
Wilcoxon：対応のあるt検定のノンパラ版

🔖 キーワード索引（深掘り版）

論文・記事に登場する用語のリンクで該当箇所へジャンプ：

🧮 SSDSE 実値計算 ⚠️ 落とし穴 6選 🐍 Python バリエーション 🔗 関連用語調整済み R² 疑似 R² アウトサンプル R² 予測 R²

🧮 SSDSE-B 実値計算例：「人口」を家計支出で予測した R² と限界

SSDSE-B-2026（47都道府県、 2023年）で、都道府県人口（A1101）を家計の食品支出 3 項目（魚介・肉・野菜）で予測する。単回帰と重回帰で R² がどう変わるか実際の数値で見ます。

📊 モデル比較（仮想的な実値例）

モデル	説明変数	R²	調整済み R²	AIC
M1：単回帰	魚介のみ	0.04	0.02	1234
M2：単回帰	肉のみ	0.21	0.19	1212
M3：重回帰	魚介+肉+野菜	0.28	0.23	1209
M4：M3+ランダム10変数	13変数	0.55	0.36	1218

💡 洞察：M4 のように意味のないランダム変数を10個追加すると R² は 0.28 → 0.55 へ大きく増えますが、調整済み R²は 0.23 → 0.36 と増分が小さく、 AIC も悪化（1209 → 1218）。「R² 単独では過学習を見抜けない」現実が確認できます。

📊 アウトサンプル R²（一般化された決定係数）

訓練データの R² と、 5-fold CV による外挿 R² は別物です。 47県のような小データでは：

訓練 R² = 0.28（M3 全データフィット）
CV R² = 0.12（5-fold 平均）← 過学習の証拠
差 = 0.16 → 訓練データへの過剰適合

⚠️ R² の落とし穴（深掘り版・6件）

① 変数を増やすほど R² は必ず上がる

OLS の数学的性質として、説明変数を追加すれば R² は絶対に下がらない（最悪、同じ）。意味のない変数（コインの裏表など）を加えても R² は上がるので、「R² が高い = 良いモデル」とは限らない。必ず調整済み R²（自由度補正）か AIC/BIC を併用してモデル選択する。さらに最重要なのはアウトサンプル R²（CV やホールドアウト）で、訓練 R² の楽観バイアスを除いた評価をすること。

② 「R² が高い = 因果関係」と誤解する

R² が 0.95 でも、それは「相関の二乗が大きい」だけで、因果関係を保証しません。アイスクリーム売上から溺死者数を予測すれば R² が高くなりますが、「アイスを売れば溺死者が出る」わけではない（夏という共通原因）。 R² は当てはまりであって因果効果ではない。因果には DiD、 IV、 RDD、因果フォレスト等の専用手法が必要。

③ 領域による R² の基準を知らない

物理科学（再現実験ベース）では R² > 0.95 を期待しますが、社会科学では人間行動の複雑さから R² = 0.3 でも実用的、金融時系列では R² = 0.05 でも極めて貴重です。「R² が低い = 悪いモデル」と即断するのではなく、そのドメインで何が標準的か、ベースラインモデル（平均予測など）と比べてどれだけ改善しているかを判断する。

④ 非線形モデル / GLM で R² を素直に使う

OLS の R² は「線形回帰で SS_tot を SS_res と SS_reg に直交分解できる」前提に立ちます。ロジスティック回帰やポアソン回帰など GLM では、残差の和が 0 にならず、 R² の解釈が崩れる。代わりに McFadden 疑似 R²、 Cox-Snell R²、 Nagelkerke R² を使う。これらは「対数尤度の比」をもとに定義され、 OLS の R² より基準が低い（McFadden 0.2-0.4 で良いフィット）。

⑤ R² の値を異なるデータ間で比較する

R² は SS_tot の大きさに依存します。つまり同じモデルでも、 y のばらつきが大きいデータほど R² が大きく見えやすい。「業界 A での R² = 0.8 と業界 B での R² = 0.6 だから A モデルが優秀」とは言えない。比較すべきは同じデータでの異なるモデル間か、標準化された予測誤差（RMSE/y_std、 MAPE等）です。

⑥ 異常値が R² を歪めるのを見落とす

R² は二乗和に基づくので、 1〜2 個の極端な外れ値が R² を大きく変えます。「R² = 0.9 だが、 1つの極端な観測を除くと R² = 0.3」というケースは現実によくある。必ず散布図と残差プロットで個別の点を確認、 Cook's distance や leverage で影響力の大きい点を特定する。ロバスト回帰（Huber、 LAD）を併用する手もあります。

🐍 Python 実装バリエーション

① scikit-learn の r2_score

🎯 解説: 重回帰モデル（説明変数 2 以上）の R² を計算し、 説明変数を増やしたときの当てはまり改善を確認する。 説明変数を追加すると R² は必ず増加（または維持）するため、 過学習に注意。

from sklearn.metrics import r2_score
from sklearn.linear_model import LinearRegression
model = LinearRegression().fit(X_train, y_train)
print(r2_score(y_test, model.predict(X_test)))  # テストの R²
print(model.score(X_train, y_train))  # 訓練の R²

📥 入力例: data/raw/SSDSE-B-2026.csv
  説明変数: A1101（総人口）, A4101（出生数）, A6101（死亡数）
  目的変数: C120120（県内総生産）

📤 実行例: R² (単回帰)  = 0.991
  R² (重回帰)  = 0.994
  説明変数追加で +0.3 ポイント上昇

💬 読み方: 重回帰では R² が単回帰より必ず上がる。 しかし「真に説明力が増したか」は調整済み R² で確認する必要がある。 同じ R² なら説明変数が少ないモデルが望ましい（オッカムの剃刀）。

注意：r2_score は負の値もとり得る（ベースラインより悪い場合）。 sklearn 公式の定義では y の平均を予測するモデルを下回る場合は R² < 0 になります。

② statsmodels（調整済み R²、検定統計量つき）

🎯 解説: scikit-learn の LinearRegression で計算した R² と、 sklearn.metrics の r2_score 関数で計算した R² が一致することを確認する。 検証用にもう一段、 「相関係数の 2 乗 r²」とも一致するかを単回帰で確認する。

import statsmodels.api as sm
res = sm.OLS(y, sm.add_constant(X)).fit()
print(res.rsquared, res.rsquared_adj)
print(res.aic, res.bic)  # モデル選択用

📥 入力例: data/raw/SSDSE-B-2026.csv
  X: A1101（総人口）47 都道府県
  y: C120120（県内総生産）

📤 実行例: model.score(X, y) = 0.9912
  r2_score(y, y_pred) = 0.9912
  相関係数² = 0.9912 (単回帰時のみ一致)

💬 読み方: 単回帰では R² = r² が成立。 重回帰では成立しない（R² は重相関係数の 2 乗に対応）。 sklearn の score() メソッドは常に R² を返す（予測精度の標準指標）。

③ scipy.stats.pearsonr — 単回帰なら相関²

単回帰なら $R^2 = r^2$。 scipy で相関を計算し、 2乗するだけで OK。

🎯 解説: SSDSE-B-2026 の総人口（A1101）を説明変数、 県内総生産（C120120）を目的変数として単回帰を実行し、 決定係数 R² で当てはまりを評価する。 R² は「目的変数の分散のうちモデルが説明できる割合」を表し、 0〜1 の範囲で 1 に近いほど良い当てはまり。

1
2
3

from scipy.stats import pearsonr
r, p = pearsonr(x, y)
print(f"単回帰の R² = {r**2:.3f}")

📥 入力例: data/raw/SSDSE-B-2026.csv
  47 都道府県 × 説明変数 1（A1101）, 目的変数（C120120）
  東京都 14,047,594 → 県内総生産 約 115 兆円
  鳥取県    540,000 → 県内総生産 約 1.9 兆円

📤 実行例: R² = 0.991
  傾き b = 7.85
  切片 a = -1.34e5
  → 人口が県内総生産の 99.1% を説明

💬 読み方: R² が 0.99 と極端に高い理由は、 県内総生産が「人口の規模」にほぼ比例するため。 ただし R² が高い=因果ではなく、 産業構造や生産性などの交絡要因に注意。 社会科学では R² > 0.3 でも実用的と見なされる。

④ クロスバリデーション R²

🎯 解説: 重回帰モデル（説明変数 2 以上）の R² を計算し、 説明変数を増やしたときの当てはまり改善を確認する。 説明変数を追加すると R² は必ず増加（または維持）するため、 過学習に注意。

from sklearn.model_selection import cross_val_score
scores = cross_val_score(LinearRegression(), X, y,
                          cv=5, scoring='r2')
print(scores.mean(), scores.std())

📥 入力例: data/raw/SSDSE-B-2026.csv
  説明変数: A1101（総人口）, A4101（出生数）, A6101（死亡数）
  目的変数: C120120（県内総生産）

📤 実行例: R² (単回帰)  = 0.991
  R² (重回帰)  = 0.994
  説明変数追加で +0.3 ポイント上昇

💬 読み方: 重回帰では R² が単回帰より必ず上がる。 しかし「真に説明力が増したか」は調整済み R² で確認する必要がある。 同じ R² なら説明変数が少ないモデルが望ましい（オッカムの剃刀）。

⑤ McFadden 疑似 R²（GLM 用）

🎯 解説: scikit-learn の LinearRegression で計算した R² と、 sklearn.metrics の r2_score 関数で計算した R² が一致することを確認する。 検証用にもう一段、 「相関係数の 2 乗 r²」とも一致するかを単回帰で確認する。

# statsmodels GLM
res_full = sm.GLM(y, X, family=sm.families.Binomial()).fit()
res_null = sm.GLM(y, np.ones((len(y), 1)), family=sm.families.Binomial()).fit()
pseudo_r2 = 1 - res_full.llf / res_null.llf
print(f"McFadden R² = {pseudo_r2:.3f}")

📥 入力例: data/raw/SSDSE-B-2026.csv
  X: A1101（総人口）47 都道府県
  y: C120120（県内総生産）

📤 実行例: model.score(X, y) = 0.9912
  r2_score(y, y_pred) = 0.9912
  相関係数² = 0.9912 (単回帰時のみ一致)

💬 読み方: 単回帰では R² = r² が成立。 重回帰では成立しない（R² は重相関係数の 2 乗に対応）。 sklearn の score() メソッドは常に R² を返す（予測精度の標準指標）。

🗺️ 概念マップ — 3つの視点で体系を理解する

決定係数 R² がデータサイエンスの体系の中でどこに位置するかを、 3つの異なる視点で可視化します。同じ情報でも見方を変えると気付きが変わります。

📍 体系階層のパス

🌐 統計・データサイエンス › 関連・回帰 › 回帰 › R²

① 🔗 関係マップ — 「他の手法とどう繋がっているか」

中心の概念から放射状に、前提・兄弟・発展形・応用先などの関係性を矢印で結びます。 横の繋がりを見るのに最適。ノードをドラッグ、ホイールでズーム、クリックで遷移。

凡例：現在の用語上位カテゴリ兄弟（並列）前提発展形応用先2階層先

② ⭕ 包含マップ — 「どのカテゴリに含まれているか」

大きな円が小さな円を包含する Circle Packing 図。 「決定係数 R²」は緑色でハイライト。

カテゴリ円をクリック：その内部にズームイン
白背景クリック：1階層戻る
用語円をクリック：詳細ページへ遷移
マウスホバー：階層パス表示

📍現在地：統計・データサイエンス

③ 🌳 ツリーマップ — 「面積で見るボリューム比較」

長方形を入れ子に分割した Treemap 図。 各分野の規模感を面積で比較。 「決定係数 R²」は緑色でハイライト。

カテゴリ矩形をクリック：その内部にドリルダウン
パンくず（上のリンク）クリック：その階層に戻る
用語矩形をクリック：詳細ページへ遷移
マウスホバー：階層パスと値を表示

📍パンくず：統計・データサイエンス

🎯 3つのマップの使い分け

マップ	分かること	こんな時に見る
🔗 関係マップ	手法間の横の関係（前提→発展→応用）	「次に何を学べばよい？」学習順序の判断
⭕ 包含マップ	分類体系の入れ子構造（上位⊃下位）	「この手法はどんなジャンルに属する？」
🌳 ツリーマップ	分野の規模比較（面積=ボリューム）	「データサイエンス全体の俯瞰像」

💡 ジャストインタイム学習のヒント：3つの視点を行き来することで、概念を多角的に理解できます。包含マップやツリーマップはズーム/ドリルダウンで大分類から細部まで探索できます。

指標	分子	分母	解釈
R²	ESS	TSS	説明割合
MSE	RSS	n	平均誤差²
RMSE	√RSS	√n	単位付き誤差
調整 R²	RSS/(n-p-1)	TSS/(n-1)	自由度補正

指標	数式	範囲	代表的用途
古典 R²	1 − RSS/TSS	(−∞, 1]	線形回帰
McFadden R²	1 − ln L_M / ln L_0	[0, 1)	ロジスティック回帰
Cox-Snell R²	1 − (L_0/L_M)^(2/n)	[0, <1)	一般化線形モデル全般
Nagelkerke R²	Cox-Snell / max(Cox-Snell)	[0, 1]	Cox-Snell の正規化版
調整 R²	1 − (1−R²)(n−1)/(n−p−1)	(−∞, 1]	変数数を罰する版

実験	観察された挙動	実務的含意
1. ノイズ	線形に R² 低下	SNR (信号雑音比) の事前推定が重要
2. 過剰変数	訓練 R² と CV R² の乖離	必ず CV で検証する
3. 小標本	分散と過大評価	調整 R² または CV 必須

場面	推奨指標	補助指標
線形回帰の説明力	R²	RMSE
変数選択	調整 R²	AIC, BIC
予測性能評価	CV R²	RMSE, MAE
ロジスティック回帰	McFadden R²	AUC, 対数尤度
時系列	調整 R²	残差自己相関

項目	必須？	理由
R² の値（小数点以下 2-4 桁）	必須	主指標
調整 R²	推奨	変数数バイアスの補正
標本サイズ n	必須	小標本では過大評価
説明変数の数 p	必須	調整 R² と関連
CV R²（テスト R²）	推奨	汎化性能
非線形なら擬似 R² 種類	必須	McFadden / Cox-Snell の区別
RMSE / MAE 併記	推奨	単位付きの実用解釈

分野	良い R² の目安	備考
物理学・工学	0.95 以上	法則性が強い
疫学・公衆衛生	0.3 でも有用	個人差が大きい
マクロ経済学	0.7 ぐらいで標準	時系列の傾向効果
マーケティング	0.2-0.5	消費者行動のノイズ大
心理学	0.1-0.4	個人差が大きい
機械学習（画像）	用途次第	非線形性が強い

列	意味	関係する量
df	自由度	変数数 / 標本サイズ
SS	平方和	ESS / RSS の構成要素
MS	平均平方	SS / df
F	統計量	MS_M / MS_Res
p	確率値	F 分布から計算