グリッドサーチ | 用語解説

🔖 キーワード索引

ハイパーパラメータ交差検証GridSearchCVscoringparam_gridbest_params_RandomizedSearchCVBayesian OptimizationOptuna計算コスト

別名・略称：（なし）

💡 30秒で分かる結論

グリッドサーチ（Grid Search）：ハイパーパラメータの組合せを網羅的に試す手法

グリッドサーチ＝モデルのハイパーパラメータの候補値の組合せを全パターン試して、一番良いものを選ぶ網羅探索。
scikit-learn の GridSearchCV が定番。内部で交差検証と組み合わせて評価する。
全組合せ数は 各パラメータの候補数の積。 4変数×5候補で 625 通り → 計算コスト爆発に注意。
RandomizedSearchCV（ランダム抽出）や Optuna（ベイズ最適化）が現代の代替手段。
テストデータでハイパラを決めるとリーク。訓練データの中で更に CV を回す。

📍 あなたが今見ているもの

機械学習モデルには 「学習で決まる重み」（例：回帰係数） と 「人間が指定する設定値」（ハイパーパラメータ） があります。 Ridge 回帰の α、ランダムフォレストの n_estimators、 SVM の C や gamma など。これらを「総当たり」で試して最良を選ぶのがグリッドサーチ。論文の 「best parameters were selected via grid search with 5-fold CV」 という記述が出てきたら、これのことです。

🎨 直感で掴む

グリッドサーチの動作イメージ

Ridge回帰の正則化強度 α を選びたいとします。候補：[0.01, 0.1, 1, 10, 100]。

α=0.01 で学習 → 5-fold CV で平均 RMSE を測定
α=0.1 で学習 → 平均 RMSE を測定
同様に α=1, 10, 100 まで全て測定
5 つの RMSE の中で 最小のもの に対応する α を採用

2 パラメータなら格子状（grid）に組合せが並ぶので「グリッドサーチ」。

α \ C	0.01	0.1	1	10
linear	0.52	0.48	0.41	0.45
rbf	0.55	0.50	0.43	0.47

上記の例なら (C=1, kernel=linear) で CV-RMSE = 0.41 が最小なのでこれを採用。

📐 定義 / 数式

【グリッドサーチの定式化】

$$\theta^* = \arg\min_{\theta \in \Theta_{\text{grid}}} \frac{1}{K} \sum_{k=1}^{K} L(\mathcal{D}_k^{\text{val}}, \hat{f}_{\theta}(\mathcal{D}_k^{\text{train}}))$$

$\Theta_{\text{grid}}$ は探索する格子、 K は CV の分割数

【総組合せ数】

$$|\Theta_{\text{grid}}| = \prod_{j=1}^{p} |\Theta_j|$$

パラメータ数 p の積で組合せが指数的に増える（curse of dimensionality）

🔬 記号・式を言葉で読み解く

$\theta$: ハイパーパラメータベクトル。例：$(\alpha, C, \gamma)$
$\Theta_{\text{grid}}$: ユーザが指定した候補値の格子。例：$\{0.01, 0.1, 1, 10\}^3$
$K$: 交差検証の分割数。通常 5 か 10。
$L$: 評価指標。回帰なら RMSE/MAE、分類なら accuracy/F1。

🧮 実データで計算してみる

SSDSE データで Ridge 回帰の最適な α を選ぶ：

α	5-fold CV の RMSE 平均
0.01	0.512
0.1	0.488
1.0	0.475 ← 最小
10	0.503
100	0.621

α=1.0 が最良 → モデル最終化はこの α で全訓練データを使って再学習し、ホールドアウトしておいたテストで最終評価。

🐍 Python 実装

SSDSE-B-2026（47 都道府県・2023 年データ）を題材にした最小コード：

from sklearn.model_selection import GridSearchCV
from sklearn.linear_model import Ridge

param_grid = {'alpha': [0.01, 0.1, 1, 10, 100]}
gs = GridSearchCV(Ridge(), param_grid, cv=5, scoring='neg_root_mean_squared_error')
gs.fit(X_train, y_train)

print('Best:', gs.best_params_, '| CV RMSE:', -gs.best_score_)
best_model = gs.best_estimator_

⚠️ よくある落とし穴

⚠️ テストデータでハイパラを決める

テストが擬似的に訓練に使われ、真の汎化性能を過大評価。 → 訓練データ内で CV を回す。

⚠️ 組合せ数の爆発

4パラメータ×10候補で 10,000 通り。計算量が現実的でない。 → RandomizedSearch または Optuna。

⚠️ 離散候補しか試せない

α=0.5 がベストでも、候補が [0.1, 1, 10] だと見つからない。 → 連続最適化（ベイズ最適化）の方が効率的。

⚠️ CV の foldごとに前処理を fit していない

標準化を全訓練データで先に fit するとリークが起きる。 → Pipeline 内で組む。

⚠️ scoring 指定ミス

GridSearchCV はデフォルトでスコアを最大化する。損失系の指標は neg_ プレフィックスを使う。

🌐 関連手法・この用語を使う論文

📄 予測モデルを使う論文全般

ハイパーパラメータ調整は本サイトの多くの予測モデル論文で実施されています。

🔖 キーワード索引

グリッドサーチGrid SearchHPOクロスバリデーションRandomSearchOptunaBayesian OptGridSearchCV

本ページは グリッドサーチ（Grid Search）を 12 のセクションで多角的に解説します。上のチップは検索・関連語の手がかりです。以下のリンクで各セクションに直接ジャンプできます：

💡 30秒結論｜ 📍 文脈｜ 🎨 直感｜ 📐 数式｜ 🔬 記号読み解き｜ 🧮 実値計算｜ 🐍 Python 実装｜ ⚠️ 落とし穴｜ 🌐 関連手法｜ 🔗 関連用語｜ 📚 グループ教材

💡 30秒で分かる結論

定義：ハイパーパラメータの組合せを網羅的に試す手法
分野：ML基礎
典型用途：以下「📍 文脈」と「🎨 直感で掴む」を参照
覚えておく要点：数式は 1 つ・落とし穴 5 つ・関連用語 12 個
注意点：表面的な定義の暗記より、いつ・どう使うかを理解することが優先

📍 文脈 — どこで使う概念か

グリッドサーチは ハイパーパラメータの候補を格子状に並べ、全組合せを試して最良を選ぶ手法。シンプルで実装容易だが、候補数が指数的に増えるため 3–4 ハイパラまでが現実的。それ以上は Random Search や Bayesian Optimization に切り替える。

🎨 直感で掴む — 具体例で理解する

Grid Search は「地図上の格子点を全部歩いてみる」イメージ。確実だが時間がかかる。一方、ハイパラの一部だけが性能に影響することが多い（Bergstra & Bengio 2012）ため、 Random Search の方が同じ計算量で良い解に到達することが知られる。とはいえ Grid は「結果が再現的・説明しやすい」ため、候補が少ない時の標準。

📐 数式・定義

グリッドサーチを数式 / 形式定義で表す：

$$\hat{\boldsymbol{\lambda}} = \arg\min_{\boldsymbol{\lambda} \in \Lambda} \; \text{CV-Loss}\!\big(\text{model}_{\boldsymbol{\lambda}}\big)$$

ハイパーパラメータ集合 $\Lambda$ の中で、交差検証損失を最小にする組合せ $\hat{\boldsymbol{\lambda}}$ を選ぶ。 Grid は $\Lambda$ を直積（格子）で構成する。

🔬 数式を言葉で読み解く

上の数式に出てきた記号を 1 つずつ解説します。数式が出てくる試験問題（統計検定・G 検定・基本情報）では、各記号の意味を答えられるかが分岐点：

記号	意味
$\boldsymbol{\lambda}$	ハイパーパラメータベクトル
$\Lambda$	候補集合（格子）
CV-Loss	交差検証損失
$\hat{\boldsymbol{\lambda}}$	選ばれた最適ハイパラ

🧮 SSDSE-B 実値計算 — 都道府県データで手を動かす

SSDSE-B-2026 の 「総人口 → 出生数」回帰で、ランダムフォレストの 3 ハイパラ（n_estimators / max_depth / min_samples_leaf）を Grid Search し、最良 R² を出すパラメータを発見する。

使用データ：SSDSE-B-2026.csv（独立行政法人統計センター提供、 47 都道府県 × 100 超の社会経済指標）。出典

import pandas as pd
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import GridSearchCV

df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='cp932', skiprows=1)
df = df.rename(columns={df.columns[2]: 'pref'})

X = df[['A1101', 'A1303', 'F3101']].fillna(0).values
y = df['A4101'].values

param_grid = {
    'n_estimators':     [50, 100, 200],
    'max_depth':        [3, 5, 7, None],
    'min_samples_leaf': [1, 2, 4],
}
gs = GridSearchCV(RandomForestRegressor(random_state=42),
                  param_grid, cv=5, scoring='r2', n_jobs=-1)
gs.fit(X, y)
print(f'Best params: {gs.best_params_}')
print(f'Best CV R² : {gs.best_score_:.4f}')

▲ 上記コードはそのまま実行可能。 CP932 エンコーディング・skiprows=1（英語ヘッダ行をスキップ）・列名の英数字コード（A1101 = 総人口など）に注意。

🐍 Python 実装バリエーション

「グリッドサーチ」を扱う代表的なライブラリ別実装。同じ目的でも書き方が違うため、自分のプロジェクトの依存関係に合わせて選択する：

① pandas + numpy（最小依存）

import pandas as pd
import numpy as np

df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='cp932', skiprows=1)
df = df.rename(columns={df.columns[2]: 'pref'})

print('行数:', len(df), '列数:', df.shape[1])
print(df[['pref', 'A1101', 'A4101', 'A5101', 'F3101']].head())

② scikit-learn（学習・評価）

from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score, mean_squared_error
from sklearn.model_selection import train_test_split
import numpy as np

X = df[['A1101', 'A1303']].fillna(0).values
y = df['A4101'].values
X_tr, X_te, y_tr, y_te = train_test_split(X, y, test_size=0.2, random_state=42)
m = LinearRegression().fit(X_tr, y_tr)
pred = m.predict(X_te)
print(f'R²   = {r2_score(y_te, pred):.3f}')
print(f'RMSE = {np.sqrt(mean_squared_error(y_te, pred)):.2f}')

③ scipy.stats（統計検定・分布）

from scipy import stats

# 例: 2 変数の Pearson 相関 + p 値
r, p = stats.pearsonr(df['A1101'], df['A4101'])
print(f'相関係数 r = {r:.3f}, p 値 = {p:.2e}')

# 例: 1 標本 t 検定（平均が一定値と異なるか）
t, p = stats.ttest_1samp(df['A4101'], popmean=df['A4101'].mean())
print(f't = {t:.3f}, p = {p:.3f}')

④ 可視化（matplotlib + seaborn）

import matplotlib.pyplot as plt
import seaborn as sns

fig, ax = plt.subplots(figsize=(8,5))
sns.scatterplot(data=df, x='A1101', y='A4101', ax=ax)
ax.set_xlabel('総人口')
ax.set_ylabel('出生数')
ax.set_title(f'{len(df)} 都道府県の関係')
plt.tight_layout()
plt.savefig('out.png', dpi=120)
plt.close()

⚠️ よくある落とし穴（5 件）

「グリッドサーチ」を実務・試験で扱うときに頻発する典型的なミスです。各項目を 1 度読んでおけば 9 割の事故が防げます：

❌ 計算量爆発

3 ハイパラ × 各 5 値 = 125 通り、さらに CV=5 で 625 学習。候補は計画的に絞る。

❌ 評価データへの過適合

Grid を CV 無しで Test スコアで決めると、 Test に過適合。必ず CV を回す。

❌ 無関係ハイパラを混ぜる

性能に効かないハイパラを格子に入れると無駄。事前に感度分析を。

❌ 離散値だけで離散化が粗い

学習率 [0.001, 0.01, 0.1] のような対数スケールを使うか、 Random Search で連続探索。

❌ ベストの再現性

Grid 結果は random_state を固定しないと毎回ブレる。シード固定 + n_jobs=1 で完全再現。

🌐 関連手法・派生

「グリッドサーチ」と同じ系統で覚えると効率的な手法・概念：

手法	用語ページ
Random Search	random-search.html
Bayesian Optimization	bayesian-optimization.html
Optuna	optuna.html
ハイパラ調整	hyperparameter-tuning.html

📌 まとめカード — 試験前 1 分復習

用語	グリッドサーチ
英語	Grid Search
カテゴリ	ML基礎
一言定義
出題されやすい論点	隣接概念との違い・典型手法・落とし穴
使用データ例	SSDSE-B-2026.csv（47 都道府県社会経済指標）

🗓 歴史・年表

本用語の主要なマイルストーン：

年	出来事
1990s	ハイパラ網羅探索の概念定着
2007	scikit-learn が GridSearchCV を実装
2012	Random Search が Grid を上回る（Bergstra & Bengio）
2013	ベイズ最適化（Spearmint）
2019	Optuna 公開で TPE が標準化

📊 比較表 — 同カテゴリの主要選択肢

「グリッドサーチ」と関連する手法・概念を比較しておくと、使い分けに迷わない：

項目	特徴	補足
Grid Search	格子全列挙	再現性・解釈容易
Random Search	確率的サンプリング	効率良し・連続値可
Bayesian Opt (TPE)	事前分布更新	少 trial で良解
Hyperband / BOHB	早期打切 + Bayes	深層学習で標準
Evolutionary	遺伝的アルゴ	並列性高い

❓ よくある質問 (FAQ)

「グリッドサーチ」について試験対策・実務で頻出する質問とその回答：

Q. Grid と Random どちらが速い？

A. 同じ計算予算なら Random が良い解に届きやすい。 Bergstra 2012 が古典論文。

Q. Optuna は何が違う？

A. TPE で過去結果から有望領域を絞る。早期打切（Pruner）も標準装備。

Q. CV を何 fold に？

A. 5 fold が定番、データ少なければ 10 fold、多ければ 3 fold で時間短縮。

Q. ベスト解の再現性は？

A. random_state + n_jobs=1 で完全再現。並列実行は順序依存性に注意。

Q. 多目的最適化はできる？

A. Optuna NSGA-II で精度・コスト・公平性のパレートフロンティアを得られる。

📝 実践演習 — 手を動かして定着

本ページの理解を確認する 5 問の練習問題です。紙とペン、もしくは Python で取り組んでみてください：

定義の言い換え：「グリッドサーチ」を 2 行以内で自分の言葉に書き直してください。出典を引用しないこと。
カテゴリ整理：「グリッドサーチ」が属するカテゴリ「ML基礎」内で、隣接する 3 用語を挙げ、それぞれとの違いを 1 文で書く。
SSDSE-B-2026 で実装：本ページの「🧮 実値計算」のコードを実行し、出力結果をスクリーンショットで残す。
落とし穴チェック：本ページの「⚠️ 落とし穴」5 件のうち、自分が実際にやってしまいそうな 1 件を選び、防止策を 100 字で書く。
応用シナリオ：「グリッドサーチ」を新しい問題（自分の業務 or 卒研テーマ）に当てはめると、どの場面で何のために使えるか、 200 字で書く。

💡 ヒント：練習問題の答えは正解が 1 つではありません。思考プロセスを書き残すことが学習効果を高めます。

🔬 発展トピック

「グリッドサーチ」を入門レベルで習得した次に進むべき発展テーマ：

① 理論的拡張

基本概念を確率論・情報理論・最適化理論の観点で再定式化すると、隣接する手法との理論的な関係が見えてきます。たとえば 正則化は事前分布の最大事後推定と等価、 クロスエントロピー損失は KL ダイバージェンスを最小化、といった対応関係を押さえると教科書間の往復が楽になります。

② 実装的拡張

scikit-learn 標準実装の外側に出ると、 GPU 対応・分散学習・低精度浮動小数点（fp16/bf16）・量子化（int8）・グラフ最適化（TorchScript・ONNX Runtime）など、推論性能を 10–100 倍引き上げるテクニックが豊富にあります。本番運用では モデル精度と推論コストのトレードオフを意識した実装が鍵。

③ 評価・解釈の拡張

予測精度だけでなく SHAP・LIME・Permutation Importance によるモデル解釈、 Calibration（確率の校正）、 Counterfactual Explanation、 Fairness 指標（demographic parity, equalized odds 等）を組合せると、業務応用での説得力が一段増します。

④ 業界応用

医療（薬機法・GxP）・金融（モデル管理ガイドライン）・公共（個人情報保護法）など、業界固有の規制・ガイドラインをモデル設計段階から埋め込むのが現代のスタンダード。「グリッドサーチ」を業務適用するときは、ドメインの専門家・法務との早期コラボレーションが成否を分けます。

📚 参考文献・学習リソース

「グリッドサーチ」をさらに深掘りするための一次資料・教科書・オンラインコース：

はじめてのパターン認識（平井有三、森北出版）— 古典 ML の網羅的入門
Pattern Recognition and Machine Learning（Bishop, Springer）— 数理的に厳密
Deep Learning（Goodfellow, Bengio, Courville）— 深層学習の標準教科書
The Elements of Statistical Learning（Hastie, Tibshirani, Friedman）— 統計学習の正典
scikit-learn ユーザーガイド — Python 実装の決定版オンライン教材
Hugging Face Course — Transformer/LLM の無料コース
Kaggle Learn — 短時間で実践スキルが身につくマイクロコース
JDLA G 検定公式テキスト — 日本の AI 資格対策に最適
統計検定公式問題集 — 統計理論の橋渡しに有用
JMOOC / Coursera / edX — 大学レベル講義を無料/低価格で受講可能

🔍 深掘り解説 — 中級者向け補強

Grid Search は「確実だが計算量が指数爆発する」探索法。ハイパラが 3 個・各 5 値なら 125 通り、さらに 5-Fold CV なら 625 学習。これが現実的なのは古典 ML までで、深層学習では Random Search や Optuna の方が効率良い。 Grid の真価は「結果の再現性・説明容易性」にあり、学術論文や監査対象モデルで好まれる。

📋 代表シナリオ一覧

Grid Search のチューニング対象：

シナリオ	概要	データ／環境	評価指標
Ridge / Lasso	alpha（正則化強度）	対数スケール 5-10 点	10 倍ステップ
SVM	C, gamma	対数スケール 5 点 × 2 = 25	RBF kernel が標準
Random Forest	n_estimators, max_depth, min_samples_leaf	3 × 4 × 3 = 36	並列化可能
XGBoost	learning_rate, max_depth, n_estimators	Random Search 推奨	Optuna が現代標準
Neural Net	lr, batch_size, layers	Hyperband / BOHB	Grid は非現実的

💼 ビジネス文脈での扱い

「グリッドサーチ」を業務適用する際は、 (1) 業務 KPI と評価指標の対応、 (2) データの収集・保管・更新コスト、 (3) 社内承認とコンプライアンス、 (4) 運用人員の確保、 (5) 失敗時のロールバック計画の 5 観点をプロジェクト計画書に必ず明記してください。技術検証（PoC）の段階で本番運用要件を逆算しておくと、後の本番化フェーズで詰まる確率が下がります。

🧪 学習ロードマップ

定義の把握：本ページの「📐 数式・定義」を 3 回読む
具体例の理解：「🎨 直感で掴む」と「🧮 実値計算」のコードを実行する
落とし穴の暗記：「⚠️ 落とし穴」5+ 件を 1 行ずつ自分の言葉で要約
関連概念の整理：「🔗 関連用語」を前提・並列・発展でマインドマップに描く
応用問題：自分の業務 or 卒研テーマに本概念を適用してみる
説明テスト：他人に 3 分で説明できるか試す。詰まったポイントを補強

🗂 ミニ用語集 — 本ページ頻出語

「グリッドサーチ」を学ぶ過程で頻出する関連語を 12 個、短文定義でまとめます。知らない語があれば各ページにジャンプしてください：

機械学習 (ML): データからパターンを自動で学ぶ手法。 AI の中核技術。
深層学習 (DL): 多層ニューラルネットによる ML。画像・言語で強い。
教師あり学習: 入力と正解ラベルのペアから学習する枠組み。
教師なし学習: 正解ラベルなしで構造を見つける学習。クラスタリング等。
強化学習: 環境との相互作用と報酬から最適行動を学ぶ。
汎化: 学習データに含まれない未知データでも性能を出すこと。
過学習: Train データに適合しすぎ、未知データで性能が落ちる現象。
交差検証 (CV): データを K 分割し平均で評価。小データのロバスト評価。
特徴量エンジニアリング: 予測精度を上げるために変数を設計・変換する作業。
評価指標: RMSE・F1・AUC など、モデル性能を測る尺度。
ハイパラ調整: 学習で直接決まらない設定値を体系的に最適化する作業。
MLOps: ML モデルの本番化・運用・監視・再学習を統合する活動。

本用語集は 484 用語を 100 グループ教材と連動して整理しています。周辺概念を 1 つずつ辿ると、「グリッドサーチ」の位置づけと使い分けが立体的に理解できます。

🔖 キーワード索引

💡 30秒で分かる結論

📍 あなたが今見ているもの

🎨 直感で掴む

グリッドサーチの動作イメージ

📐 定義 / 数式

🔬 記号・式を言葉で読み解く

🧮 実データで計算してみる

🐍 Python 実装

⚠️ よくある落とし穴

🌐 関連手法・この用語を使う論文

🔗 関連用語（前提・並列・発展）

📚 関連グループ教材

🔖 キーワード索引

💡 30秒で分かる結論

📍 文脈 — どこで使う概念か

🎨 直感で掴む — 具体例で理解する

📐 数式・定義

🔬 数式を言葉で読み解く

🧮 SSDSE-B 実値計算 — 都道府県データで手を動かす

🐍 Python 実装バリエーション

① pandas + numpy（最小依存）

② scikit-learn（学習・評価）

③ scipy.stats（統計検定・分布）

④ 可視化（matplotlib + seaborn）

⚠️ よくある落とし穴（5 件）

🌐 関連手法・派生

🔗 関連用語（前提・並列・発展）

📘 前提となる用語

📗 並列・対比される用語

📕 発展・関連派生

📚 関連グループ教材

📌 まとめカード — 試験前 1 分復習

🗓 歴史・年表

📊 比較表 — 同カテゴリの主要選択肢

❓ よくある質問 (FAQ)

📝 実践演習 — 手を動かして定着

🔬 発展トピック

① 理論的拡張

② 実装的拡張

③ 評価・解釈の拡張

④ 業界応用

📚 参考文献・学習リソース

🔍 深掘り解説 — 中級者向け補強

📋 代表シナリオ一覧

💼 ビジネス文脈での扱い

🧪 学習ロードマップ

🗂 ミニ用語集 — 本ページ頻出語