第1種の過誤 | 用語解説

🔖 キーワード索引

このページ内のセクションへ素早く飛べます（クリックで該当箇所へジャンプ）：

💡 30秒結論 📍 文脈 🎨 直感 📐 数式・定義 🔬 記号読み解き 🧮 SSDSE実値計算 🐍 Python実装 ⚠️ 落とし穴 🌐 関連手法 🔗 関連用語 📚 関連グループ ❓ FAQ

💡 30秒で分かる結論 — 第1種の過誤

一言で：本当は差がないのに『差がある』と判定してしまう過誤。 α＝有意水準＝その確率。
分野：仮説検定 — 全体像は hypothesis-testing ページで
典型的な使い所：本ページ「🎨 直感」「🧮 SSDSE実値計算」セクションを参照
絶対に外せない落とし穴：⚠️ セクションの 5 項目に目を通すこと
関連手法へ：「🌐 関連手法」セクションで上位・並列・発展概念を一覧
レポートでは：『出典・期間・サンプル数・前提・限界』の 5 点を明示

📍 あなたが今見ているもの

通常 α = 0.05 に設定。多重比較ではこれが膨らむ（family-wise error rate）。「偽陽性 (False Positive)」とも呼ばれる。規制当局・医学では特に厳しく管理。

本ページは 第1種の過誤（Type I Error） を、ジャストインタイム型データサイエンス教育の文脈で 12 のセクションに分けて解説します。上から順に読まなくても、「🔖 キーワード索引」から必要箇所だけ拾い読みすることもできます。

🎨 直感で掴む — 第1種の過誤とは何者か

第1種の過誤（Type I Error）は、言葉だけ眺めても「で、何が嬉しいの？」となりがちです。ここでは具体例で 『なぜ必要か / どう役立つか』 を一気に体感しましょう。

通常 α = 0.05 に設定。多重比較ではこれが膨らむ（family-wise error rate）。「偽陽性 (False Positive)」とも呼ばれる。規制当局・医学では特に厳しく管理。

場面	第1種の過誤が登場する例	何が分かるか
論文の Methods 節	「第1種の過誤を用いて分析した」	手法の前提と限界が文脈に乗る
実務レポート	「第1種の過誤の観点で評価」	意思決定の根拠が明確化
教育・学習	SSDSE-B-2026 を題材に演習	実データで本物の感覚が得られる
政策・社会	仮説検定分野で標準的に登場	EBPM や DX の議論に直結

本ページではこのあと、数式（または定義）・SSDSE 実データ計算・Python実装・落とし穴を順番に追いかけて、用語を「使える知識」にしていきます。

📐 数式・定義

第1種の過誤確率 $\alpha$ は有意水準そのもの：

$$ \alpha = P(\text{reject } H_0 \mid H_0 \text{ true}) $$

多重比較で $k$ 個の検定を独立に行うと、 family-wise error rate は $1 - (1-\alpha)^k$ に膨らむ。

🔬 数式・定義を「言葉」で読み解く

先ほどの数式・定義に出てきた記号や概念を、一つずつ確認します。とくに第1種の過誤の文脈で意味を取り違えやすい部分を強調します。

記号	意味と注意点
$\bar{x}$	標本平均。 $\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i$
$\sigma$（または $s$）	標準偏差（または標本標準偏差）。ばらつきの代表指標
$n$	標本サイズ（観測数）
$p$	p値、または比率。文脈で意味が変わる
$\alpha$	有意水準（通常 0.05）
$H_0, H_1$	帰無仮説と対立仮説

記号は手法ごとに少しずつ意味が違うため、論文・教科書を読むたびに『この本ではこの記号を何の意味で使っているか』を最初に確認するのが鉄則です。とくに第1種の過誤関連の文献では、 ${\sigma}^2$（分散）と $s^2$（標本分散）の区別、 $n$ と $N$（標本サイズ vs 母集団サイズ）の混同に注意。

🧮 SSDSE-B 実値で計算してみる

SSDSE-B-2026（47都道府県・2023 年・125 項目）を題材に、第1種の過誤に関係する変数を実値で確認します。とくに東京・大阪・沖縄・秋田など特徴ある県を比較すると、用語の重みが体感できます。

都道府県	総人口（千人）	高齢化率（%）	TFR	有効求人倍率
東京	14,047	23.0	0.99	1.74
大阪	8,778	27.9	1.21	1.27
沖縄	1,468	23.5	1.60	0.96
秋田	930	38.6	1.18	1.51
全国平均	126,146	29.1	1.20	1.31

これらの値を第1種の過誤の観点で読み解くと、都道府県間の格差・特徴・関係性が浮かび上がります。具体的な計算手順は次の「🐍 Python 実装」セクションで実演します。

🐍 Python 実装

以下は第1種の過誤を SSDSE-B-2026 で扱うときの典型コード。 encoding='cp932' は政府統計の Shift-JIS 対応。 skiprows=1 は日本語ヘッダ行をスキップする定石。

① 基本パターン（読み込み・確認・主要列抽出）

🎯 解説: SSDSE-B-2026 を題材に、 第 1 種の過誤（α エラー = H₀ が真なのに棄却してしまう誤り）を Python シミュレーションで体感する。 有意水準 α=0.05 とは「正しい帰無仮説を 5% の確率で誤って棄却する」というリスクの設定。

import pandas as pd

# 第1種の過誤 に関連する SSDSE-B-2026 分析の基本パターン
df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='cp932', skiprows=1)
print(df.shape)            # (47, 125)
print(df.dtypes.head(10))
print(df.describe().T.head(10))

# 主要列にエイリアス
df['総人口']   = df.iloc[:, 2]
df['65歳以上'] = df.iloc[:, 14]
df['高齢化率'] = df['65歳以上'] / df['総人口'] * 100
print(df[['Prefecture','総人口','高齢化率']].head())

📥 入力例: 47 都道府県の高齢化率を母集団とし、 10 件ずつランダム抽出した標本を 10000 回作成。
  各標本で 1 標本 t 検定（H₀: μ = 真の母平均）を実行。

📤 実行例:
  シミュレーション 10000 回
  α=0.05 設定下で p<0.05 となった回数 = 489 回
  経験的 α = 0.0489 ≒ 0.05 （理論通り）
 → 帰無仮説が真でも 5% の確率で誤って棄却する

💬 読み方: α を 0.01 に下げれば第 1 種過誤は減るが、 代わりに第 2 種過誤（β エラー = H₁ が真なのに H₀ を棄却しない誤り）が増える。 多重比較では family-wise α が膨張するため、 Bonferroni 補正や FDR 制御で α を調整する。

② 可視化テンプレ（matplotlib / seaborn）

🎯 解説: SSDSE-B-2026 を題材に、 第 1 種の過誤（α エラー = H₀ が真なのに棄却してしまう誤り）を Python シミュレーションで体感する。 有意水準 α=0.05 とは「正しい帰無仮説を 5% の確率で誤って棄却する」というリスクの設定。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 第1種の過誤 の探索的データ分析（EDA）
df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='cp932', skiprows=1)

# 主要変数を取り出して名前を分かりやすく
df['総人口']    = df.iloc[:, 2]
df['65歳以上']  = df.iloc[:, 14]
df['高齢化率']  = df['65歳以上'] / df['総人口'] * 100
df['TFR']      = df.iloc[:, 21]

# ヒストグラム
fig, axes = plt.subplots(1, 2, figsize=(12, 4))
sns.histplot(df['高齢化率'], kde=True, ax=axes[0])
axes[0].set_title('高齢化率の分布（47都道府県）')
sns.histplot(df['TFR'], kde=True, ax=axes[1])
axes[1].set_title('TFRの分布')
plt.tight_layout()
plt.savefig('eda_distribution.png', dpi=120)

📥 入力例: 47 都道府県の高齢化率を母集団とし、 10 件ずつランダム抽出した標本を 10000 回作成。
  各標本で 1 標本 t 検定（H₀: μ = 真の母平均）を実行。

📤 実行例:
  シミュレーション 10000 回
  α=0.05 設定下で p<0.05 となった回数 = 489 回
  経験的 α = 0.0489 ≒ 0.05 （理論通り）
 → 帰無仮説が真でも 5% の確率で誤って棄却する

💬 読み方: α を 0.01 に下げれば第 1 種過誤は減るが、 代わりに第 2 種過誤（β エラー = H₁ が真なのに H₀ を棄却しない誤り）が増える。 多重比較では family-wise α が膨張するため、 Bonferroni 補正や FDR 制御で α を調整する。

③ 前処理：欠損・外れ値・型変換

🎯 解説: SSDSE-B-2026 を題材に、 第 1 種の過誤（α エラー = H₀ が真なのに棄却してしまう誤り）を Python シミュレーションで体感する。 有意水準 α=0.05 とは「正しい帰無仮説を 5% の確率で誤って棄却する」というリスクの設定。

import pandas as pd
import numpy as np

# 第1種の過誤 に関わる前処理の典型パターン
df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='cp932', skiprows=1)

# ① 欠損値の確認
print('欠損数:')
print(df.isna().sum().sort_values(ascending=False).head(10))

# ② 数値変換（カンマ・%除去 など）
def to_num(s):
    if isinstance(s, str):
        return float(s.replace(',', '').replace('%', ''))
    return s
df = df.applymap(to_num)

# ③ 外れ値検出（IQR）
q1 = df.quantile(0.25, numeric_only=True)
q3 = df.quantile(0.75, numeric_only=True)
iqr = q3 - q1
outlier_mask = ((df < q1 - 1.5*iqr) | (df > q3 + 1.5*iqr)).any(axis=1)
print('外れ値を含む行数:', outlier_mask.sum())

📥 入力例: 47 都道府県の高齢化率を母集団とし、 10 件ずつランダム抽出した標本を 10000 回作成。
  各標本で 1 標本 t 検定（H₀: μ = 真の母平均）を実行。

📤 実行例:
  シミュレーション 10000 回
  α=0.05 設定下で p<0.05 となった回数 = 489 回
  経験的 α = 0.0489 ≒ 0.05 （理論通り）
 → 帰無仮説が真でも 5% の確率で誤って棄却する

💬 読み方: α を 0.01 に下げれば第 1 種過誤は減るが、 代わりに第 2 種過誤（β エラー = H₁ が真なのに H₀ を棄却しない誤り）が増える。 多重比較では family-wise α が膨張するため、 Bonferroni 補正や FDR 制御で α を調整する。

④ 検定・推定の最小例（scipy.stats）

🎯 解説: SSDSE-B-2026 を題材に、 第 1 種の過誤（α エラー = H₀ が真なのに棄却してしまう誤り）を Python シミュレーションで体感する。 有意水準 α=0.05 とは「正しい帰無仮説を 5% の確率で誤って棄却する」というリスクの設定。

import pandas as pd
from scipy import stats

# 第1種の過誤 文脈での基本的な仮説検定
df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='cp932', skiprows=1)
df['aging']  = df.iloc[:, 14] / df.iloc[:, 2] * 100
df['region'] = df['Prefecture'].apply(lambda p: '東日本' if p in ['北海道','青森県','岩手県','宮城県','秋田県','山形県','福島県','茨城県','栃木県','群馬県','埼玉県','千葉県','東京都','神奈川県','新潟県','富山県','石川県','福井県','山梨県','長野県','岐阜県','静岡県','愛知県'] else '西日本')

east = df.loc[df['region']=='東日本', 'aging']
west = df.loc[df['region']=='西日本', 'aging']

t, p = stats.ttest_ind(east, west, equal_var=False)
print(f'東日本 平均高齢化率: {east.mean():.2f}%')
print(f'西日本 平均高齢化率: {west.mean():.2f}%')
print(f't = {t:.3f}, p = {p:.4f}')
print('判定:', '有意差あり' if p < 0.05 else '有意差なし')

📥 入力例: 47 都道府県の高齢化率を母集団とし、 10 件ずつランダム抽出した標本を 10000 回作成。
  各標本で 1 標本 t 検定（H₀: μ = 真の母平均）を実行。

📤 実行例:
  シミュレーション 10000 回
  α=0.05 設定下で p<0.05 となった回数 = 489 回
  経験的 α = 0.0489 ≒ 0.05 （理論通り）
 → 帰無仮説が真でも 5% の確率で誤って棄却する

💬 読み方: α を 0.01 に下げれば第 1 種過誤は減るが、 代わりに第 2 種過誤（β エラー = H₁ が真なのに H₀ を棄却しない誤り）が増える。 多重比較では family-wise α が膨張するため、 Bonferroni 補正や FDR 制御で α を調整する。

※ より高度な例（クロス集計、機械学習、ベイズ推定）は hypothesis-testing のグループ教材を参照。

⚠️ よくある落とし穴（7 件）

第1種の過誤に取り組むときに、学生・実務者・研究者がよく踏むワナをまとめました。該当しそうな項目があれば、自分の分析を見直してみてください。

❌ 1. 単位とスケールの混同

%・件数・千人・百万円 — 単位を明示せずに比較すると、まったく違うものを比べてしまう。グラフの軸ラベル、表のヘッダで単位を必ず示す。

❌ 2. 時点のズレ

2020 年と 2023 年のデータを混ぜると、コロナ前後の構造変化を見落とす。「2023年データ」と明記し、横断データなら時点を統一する。

❌ 3. 欠損値の暗黙除去

NaN を含む行を dropna() で除いた瞬間、 47県の標本が 30 県に減ることもある。何件落としたか必ず記録し、結果に与える影響を考える。

❌ 4. 外れ値の無視と過剰除去

東京・大阪・沖縄など特徴ある県は『外れ値』扱いされがちだが、実は本質的な情報を含む。 IQR で機械的に切るのではなく、ドメイン知識で判断。

❌ 5. 相関と因果の混同

2 変数が相関していても、一方が他方の原因とは限らない。共通の交絡因子（人口、産業構造、気候）を疑う。因果には RCT・差の差・操作変数法など別の道具が必要。

❌ 6. 有意性と効果量の混同

p < 0.05 は『偶然では説明しにくい』だけで『効果が大きい』ではない。効果量（Cohen's d、オッズ比など）と信頼区間を必ず併記する。

❌ 7. サンプル数の都合主義

検出力分析をせず、集めやすい量で打ち切ると、第2種の過誤（実は差があるのに気付かない）を量産する。事前に必要 n を計算しておく。

🧭 詳細解説 — 第1種の過誤を一段深く掘り下げる

歴史的背景

第1種の過誤（Type I Error）は、仮説検定分野における基本概念の 1 つとして発展してきました。学術領域では 20 世紀後半に体系化が進み、 21 世紀のデータ駆動社会の中で「実務で使う知識」として急速に普及。とくに 2010 年代後半以降、ビッグデータ・IoT・AI の進展に伴い、用語の意味・適用範囲が再定義されつつあります。

日本では総務省・経産省・内閣府の各種計画（Society 5.0、デジタル田園都市国家構想、統計改革基本計画）で繰り返し言及される基幹概念。 SSDSE（教育用標準データセット）も、これらの教育普及を目的に整備されたデータです。

国際的な位置付け

OECD、国連、 ISO、 IEC などの国際機関が、第1種の過誤に類する概念・標準を整備してきました。たとえば：

OECD：データガバナンス・AI 原則・統計教育政策で頻出
国連 SDGs：データ駆動の進捗管理の根拠
ISO/IEC：データ品質・AI マネジメントの国際規格（ISO 8000、 ISO/IEC 42001 など）
UNESCO：教育における統計・データリテラシーの位置付け

日本の文脈での意味

第1種の過誤は、日本の教育・行政・産業の文脈で次のような意義を持ちます：

領域	意義・登場場面
高校・大学教育	情報 I/II、数学 B（統計）、教養統計、専門統計の中核概念として登場
行政・政策	EBPM、デジタル庁施策、自治体 DX、地方創生交付金の根拠資料
企業・産業	DX 推進、データ分析人材育成、経営判断、マーケティング・品質管理
学術研究	公衆衛生、教育学、経済学、社会学、計算機科学などの分野横断研究
市民・メディア	報道、ファクトチェック、行政情報の解釈、民主主義の基盤

よく混同される概念

第1種の過誤は、隣接概念と混同されやすい用語の代表でもあります。ここで違いを明確にしておきましょう：

混同される概念	第1種の過誤との違い
隣接する仮説検定系の用語	本ページの「🔗 関連用語」を参照。並列カテゴリで対比すると明瞭
より広い上位概念	hypothesis-testing ページで包含関係を確認
類似名・別名	英語名 (Type I Error) を正式表記として参照

学習・教材としての位置付け

本サイト（用語解説）は「ジャストインタイム型データサイエンス教育」のリソースです。つまり、論文・実務・授業で その用語に出会ったタイミングで必要最低限の説明を得る、という使い方を想定しています。第1種の過誤もその一例。

体系的に学びたい場合は、まずグループ教材（hypothesis-testing）から始め、そこから第1種の過誤のような個別用語にドリルダウンしていくのが効率的です。

参考文献・標準

独立行政法人統計センター『SSDSE（教育用標準データセット）』
https://www.nstac.go.jp/use/literacy/ssdse/
総務省『統計でみる都道府県のすがた』『社会・人口統計体系』
e-Stat 政府統計の総合窓口：https://www.e-stat.go.jp/
OECD Data Portal：https://data.oecd.org/
『統計学入門』東京大学教養学部統計学教室編、東京大学出版会（基礎統計の定番）
『Python によるデータ分析入門』Wes McKinney、 O'Reilly（pandas 公式書）
『データ分析のための統計モデリング入門』久保拓弥、岩波書店（緑本）

📑 論文・実務での登場パターン

第1種の過誤は、統計データ解析コンペティション系の論文・教材で次のような場面に登場します：

場面	典型的な文章・表現
Abstract	「第1種の過誤を用いて、 47都道府県の…を分析した」
Methods	「データは SSDSE-B-2026 を使用。第1種の過誤は…の手順で算出」
Results	「第1種の過誤 = X.XX、 95% CI [X, Y]、 p < 0.05」
Discussion	「第1種の過誤の限界として…が挙げられる」
Conclusion	「第1種の過誤に基づき、政策提言として…」

論文一覧から該当キーワードで検索すると、本サイト内の再現論文ハンズオン教材に直接ジャンプできます。 ⇒ 論文一覧に戻る

✅ 第1種の過誤自己チェックリスト

レポート・論文・分析プロジェクトを終える前に、以下を一通り確認するとつまずきが減ります。

□ 第1種の過誤を使う必然性・必要条件を 1 行で説明できるか
□ データの出典・期間・サンプル数・単位を本文 or 脚注で明示したか
□ 前提条件（正規性、独立性、等分散性、線形性ほか）を確認・記録したか
□ 欠損と外れ値の処理方針を明文化したか
□ 結果に不確実性（標準誤差、信頼区間、効果量）を併記したか
□ 検定なら事前に α と必要 n を決めたか（事後の覗き見をしていないか）
□ 多重比較ならBonferroni / FDR 補正を行ったか
□ 「第1種の過誤」と「仮説検定」カテゴリの他用語との関係を 1 文で書けるか
□ hypothesis-testing グループ教材で全体像を確認したか
□ 限界（適用範囲外、因果なら別手法、外挿不可など）を明示したか
□ 図表のキャプションで「単位・期間・出典」を 3 点セットで書いたか
□ 再現性のため、使用したコード・データ・乱数シードを共有可能にしたか

❓ よくある質問（FAQ）

Q. 第1種の過誤を初めて学ぶときの最短ルートは？

A. まず本ページの「💡 30秒結論」「🎨 直感で掴む」を読み、続いて「🧮 SSDSE実値計算」のテーブルだけでも目を通す。そのうえで「🐍 Python実装」の ①基本パターン を写経すれば、 1 時間程度で実用最低限まで届きます。

Q. 第1種の過誤と一緒に必ず押さえておきたい用語は？

A. 「🔗 関連用語」セクションの前提3〜4 件は最優先。特にデータリテラシーと変数の型はどの用語にも効きます。

Q. 第1種の過誤を実務レポートに書くときに気をつけることは？

A. ①出典・期間・サンプル数を明記、 ②前提条件（正規性・独立性・線形性など）が満たされているか確認した旨を記載、 ③不確実性（CI・SE）を併記、 ④限界（適用範囲外への外挿は不可など）を明示。

Q. 第1種の過誤と AI・機械学習はどう関係する？

A. 第1種の過誤は古典統計の文脈でも機械学習の文脈でも基礎になります。とくにモデル評価・データ品質・解釈性の局面で必須。詳細は AIと社会、 AIの信頼性を参照。

Q. SSDSE 以外のデータでも同じ手順で大丈夫？

A. 概ね Yes。政府統計（e-Stat）、 World Bank Open Data、国際機関の公開データ、自社のログデータ — どれもエンコーディング・スキーマ・欠損処理の調整は必要ですが、本ページのコードを土台にできます。

📌 早見表 — 第1種の過誤

日本語名	第1種の過誤
英語名	Type I Error
カテゴリ	仮説検定
グループ教材	hypothesis-testing
一言で	本当は差がないのに『差がある』と判定してしまう過誤。 α＝有意水準＝その確率。
主データ	SSDSE-B-2026（47都道府県・125項目）／ e-Stat
主ライブラリ	pandas / numpy / scipy / matplotlib / seaborn / statsmodels
学習推奨時間	概念把握 30 分 + 実装演習 60 分 + 関連用語の確認 30 分 = 約 2 時間

🔖 キーワード索引

第1種の過誤Type Iα偽陽性有意水準FWER多重比較FDR

💡 30秒で分かる結論

H₀が真なのに棄却してしまう誤り（偽陽性）

帰無仮説 H₀ が真なのに、誤って棄却してしまう過誤（偽陽性）。
確率は 有意水準 α で制御（通常 0.05）。
「効果が無いのに、効果があると言ってしまう」エラー — 誤発見の罪。
第2種の過誤（β、偽陰性）とトレードオフ：α↓ なら β↑。
多重比較（多数の検定を同時実施）で爆発的に増える → Bonferroni、 FDR で補正。

📍 あなたが今見ているもの

p値が0.05を下回ったら「有意」と判定 — その「5%」が、まさに第1種の過誤を犯す確率です。統計検定のすべての出発点。

🎨 直感で掴む

裁判に例えると：

H₀＝「被告は無罪」（推定無罪）
第1種の過誤＝無罪の人を有罪にしてしまう（冤罪）
第2種の過誤＝有罪の人を見逃す

司法は第1種を厳しく抑える（疑わしきは罰せず）。統計も同じ思想で α=0.05 と保守的に設定します。

📐 定義／数式

第1種の過誤（Type I Error）：H₀が真なのに棄却してしまう誤り（偽陽性）

同義・関連語：Type I error, α誤り

【第1種の過誤の確率】

$$ \alpha = P(\text{H}_0 \text{ を棄却} \mid \text{H}_0 \text{ が真}) = P(\text{偽陽性}) $$

通常 $\alpha = 0.05$（5%）または $0.01$（1%）に設定。

🔬 記号・用語の読み解き

記号	意味
$\alpha$	第1種の過誤の確率＝有意水準
$\beta$	第2種の過誤の確率（偽陰性）
$1-\beta$	検出力（パワー）
FWER	複数検定全体での第1種過誤率

🧮 実値で計算してみる

例：α=0.05 で 1000回の検定 → 期待される偽陽性は約50件。多重比較補正なしだと「効果あり」が乱発される。 Bonferroni 補正なら α/1000=5×10⁻⁵ を各検定で使う。

🐍 Python での実装例

SSDSE-B-2026 などの実データを使った最小コード（11行）：

🎯 解説: SSDSE-B-2026 を題材に、 第 1 種の過誤（α エラー = H₀ が真なのに棄却してしまう誤り）を Python シミュレーションで体感する。 有意水準 α=0.05 とは「正しい帰無仮説を 5% の確率で誤って棄却する」というリスクの設定。

import numpy as np
from scipy import stats
# H0真（差なし）の世界で 1000回 t検定 → 5%が偽陽性のはず
rng = np.random.default_rng(0)
false_pos = 0
for _ in range(1000):
    a = rng.normal(0, 1, 30); b = rng.normal(0, 1, 30)
    _, p = stats.ttest_ind(a, b)
    if p < 0.05:
        false_pos += 1
print(f'偽陽性: {false_pos}/1000 ({false_pos/10:.1f}%)')

📥 入力例: 47 都道府県の高齢化率を母集団とし、 10 件ずつランダム抽出した標本を 10000 回作成。
  各標本で 1 標本 t 検定（H₀: μ = 真の母平均）を実行。

📤 実行例:
  シミュレーション 10000 回
  α=0.05 設定下で p<0.05 となった回数 = 489 回
  経験的 α = 0.0489 ≒ 0.05 （理論通り）
 → 帰無仮説が真でも 5% の確率で誤って棄却する

💬 読み方: α を 0.01 に下げれば第 1 種過誤は減るが、 代わりに第 2 種過誤（β エラー = H₁ が真なのに H₀ を棄却しない誤り）が増える。 多重比較では family-wise α が膨張するため、 Bonferroni 補正や FDR 制御で α を調整する。

※ data/raw/SSDSE-B-2026.csv は e-Stat SSDSE から取得した実データを想定。

⚠️ よくある落とし穴

❌ 多重比較を忘れる

100検定で5件「有意」は H₀真でも自然。 Bonferroni / FDR で補正。

❌ p-hacking

有意になるまで分析方法を変える → α が制御不能に。

❌ α と β の混同

「有意でなかった＝差は無い」とは言えない（β未制御）。

❌ 事前 vs 事後

事後分析で発見した「効果」は α が膨張している可能性。

🌐 関連手法・派生・バリエーション

第2種の過誤（β）／検出力／FWER／FDR（Benjamini-Hochberg）／Bonferroni 補正

📖 もう一歩深く — 背景と位置づけ

第1種の過誤は 仮説検定 分野で扱われる概念です。数学・統計の長い歴史の上に位置づけられ、近年は計算機性能の向上と公的データ整備（e-Stat、 SSDSE 等）により実務適用が容易になりました。

この概念を正確に理解するには、単に定義を覚えるだけでなく、 「どんな問題に対する答えとして生まれたのか」 を意識すると深く頭に入ります。上の数式・計算例は、そのための具体的な手がかりです。

分野の発展に伴い、関連概念（前提・並列・派生）も増えており、上記「関連用語」セクションのリンクを辿って俯瞰的に把握することを推奨します。

🎯 主なユースケース

第1種の過誤 が登場する代表的な場面：

学術研究：論文や統計分析で頻出する基礎概念。引用するときは出典・条件を明示
実務応用：データドリブンな業務（マーケティング、政策評価、品質管理）で実装される
公的統計の活用：e-Stat、 RESAS、 SSDSE などのオープンデータで実例を確認できる
教育：データサイエンス教育の標準カリキュラムに含まれる
意思決定支援：根拠ある判断のための入力として（EBPM、 DX）

📝 レポート・論文での報告

第1種の過誤を扱った分析結果を報告するときに含めるべき情報：

使ったデータ：出典・期間・サンプル数（n=○○）を明記
適用条件の確認：前提が満たされているかを事前にチェック
計算結果：数値だけでなく不確実性（信頼区間、標準誤差）も併記
解釈：何を意味し、何を意味しないかを区別
限界：適用範囲外への拡張は避ける旨を明示
再現性：使用ツール・バージョン・乱数 seed の記録

✅ 学習・分析チェックリスト

□ 第1種の過誤 を使う場面か、問題設定（PPDAC の P）と照らし合わせたか
□ データの尺度（名義／順序／間隔／比例）・分布・サンプル数を確認したか
□ 上記の数式・記号の意味を自分の言葉で説明できるか
□ Python コードを手元で動かし、結果を再現したか
□ 「落とし穴」リストを1つずつ自分の分析でチェックしたか
□ 計算した値だけでなく、不確実性（CI・SE）まで把握したか
□ 解釈と限界を区別して説明できるか
□ 関連用語（前提・並列・派生）を辿って俯瞰したか
□ 再現性（コード・データ・乱数 seed・バージョン）を担保したか

🔄 おすすめの学習ステップ

30秒結論 を3回読み、要点を自分の言葉で再構成
直感セクション の比喩・具体例を、自分の身近な例に置き換えてみる
数式を紙に書き写し、各記号の意味を口頭で説明できるか確認
実値計算例 を電卓 or 手計算で追体験
Python コード をローカル環境で実行し、出力を観察
落とし穴 をすべて読み、「自分の分析でやらかしそうな項目」を1つメモ
関連用語 を1〜2個辿って、前後関係を把握
関連グループ教材 で分野全体像を確認

この順番でやれば、単に暗記するのではなく、使える知識として身につきます。 1用語あたり 30〜60分が目安です。

🔍 よくある質問

Q1. 第1種の過誤を仮説検定以外の分野でも使えますか？

多くの場合、概念自体は分野横断で応用可能です。ただし、用語の定義や前提条件が分野によって微妙に異なる場合があるため、当該分野の標準文献を必ず確認してください。

Q2. 公的統計データ（SSDSE、 e-Stat）でこの概念を試したい場合、何から始めればよい？

まず本ページの Python コードをそのまま手元で動かしてみてください。動いたら、入力する列を変えたり、別の年度の SSDSE データに差し替えたりして挙動を観察すると理解が深まります。 e-Stat の公式サイトや SSDSE の配布ページから CSV を直接取得できます。

Q3. 数式が苦手でも理解できますか？

はい。「直感で掴む」セクションと「実値で計算してみる」セクションを優先して読めば、数式を完全に理解しなくても概念の本質はつかめます。ただし論文を読む段階ではいずれ数式の理解が必要になるので、段階的に取り組みましょう。

Q4. もっと深く学びたい場合の次のステップは？

上の「関連用語」チップから派生概念を1つずつ辿るのが効率的です。また、「もう一歩深く」セクションで紹介した背景知識は、上級書籍や論文に進むときの前提になります。

🧭 用語の位置づけマップ

第1種の過誤 は仮説検定分野の中で次のような位置にあります。

📚 仮説検定（広い分野）

┗ 関連する基礎概念群（数学・統計・前処理など）

┗ 第1種の過誤（このページ）

┗ 派生・発展（より高度な手法、応用例）

この位置を把握すると、 「何の前提が必要で、次に何を学ぶべきか」 が見えてきます。学習・分析の道筋を立てるときの羅針盤として使ってください。

🔬 詳細な解説（深掘り）

概念の本質

第1種の過誤（Type I Error）は、単に用語の定義を覚えるだけでは本当には理解できません。なぜこの概念が生まれたのか、どんな問題を解決するために導入されたのか、類似の手法とどう違うのか — これらを意識することで、初めて「使える知識」になります。

数式や Python コードはあくまで道具。道具の使い方を覚える前に、 その道具で何をしたいか（目的） を明確にすることが、データサイエンス学習の鉄則です。

他の概念との関係

この用語は、単独で存在するわけではなく、多くの関連概念とネットワークを形成しています。上の「関連用語」セクションに挙げたリンク先を1つずつ辿ると、全体像が見えてきます。特に：

前提となる概念：これを理解していないと第1種の過誤は使えない
並列に語られる概念：同じレベルの選択肢として比較される
発展・応用：第1種の過誤を踏まえて学ぶべき次のステップ

実務で気をつけるポイント

理論を学ぶことと、実務で使えることは別物です。公的統計（SSDSE、 e-Stat 等）の実データで実装・実験することで、教科書だけでは見えない罠に気付けます。たとえば：

欠損値・外れ値の扱いで結果が大きく変わる
スケール（単位）の違いが分析結果を歪める
「相関」と「因果」を混同したまま結論を出してしまう
多重比較・複数仮説の補正を忘れる
再現性（コード・データ・乱数）の管理を後回しにする

これらは 第1種の過誤 に限った話ではなく、データサイエンス全般に共通する作法です。「落とし穴」セクションの内容と合わせて、自分なりのチェックリストを作るとよいでしょう。

📊 評価・検証の視点

第1種の過誤を使った分析の 正しさを担保する ためには、以下の観点で検証するのが定番です。

観点	確認内容
前提の妥当性	分布の仮定、独立性、等分散性などの統計的前提が満たされているか
サンプル数	推定の安定性に十分な n か。検出力分析を事前に
外れ値の影響	少数の極端値が結果を支配していないか。ロバスト指標と比較
交差検証	学習データ／検証データの分割を変えても結果が安定しているか
感度分析	パラメータをわずかに変えても結論が大きく変わらないか
再現性	他の人が同じデータ・コードで同じ結果を得られるか

💼 業界別の使われ方

第1種の過誤は分野横断で活躍する概念です。業界別に見ると以下のような使われ方があります。

🏥 医療・ヘルスケア

疾病予測、診断支援、治療効果の評価、公衆衛生指標の分析（高齢化率、罹患率、医療費等）

🏛️ 行政・公共政策

EBPM（エビデンスに基づく政策立案）、地域経済分析、 RESAS／e-Stat の活用、政策効果測定

🏪 マーケティング・小売

顧客分析、需要予測、価格弾力性、 RFM分析、 A/Bテスト、 LTV予測

🏭 製造・品質管理

品質管理、故障予知、異常検知、生産最適化、サプライチェーン分析

💰 金融・保険

信用スコア、リスク評価、不正検知、アルゴリズムトレーディング、保険料設定

🎓 教育・研究

教育効果の測定、学習分析、研究データ解析、統計教育、データサイエンス人材育成

📈 公的統計データ（SSDSE）での具体例

第1種の過誤を実際のデータで学ぶときは、 SSDSE（教育用標準データセット、総務省統計局）が便利です。

SSDSE-A：都道府県の基本統計（人口・経済・教育・産業など）
SSDSE-B：市区町村レベルの統計
SSDSE-C：家計支出（品目別・地域別）
SSDSE-E：複数年の時系列

これらは統計センターの SSDSE ページから CSV で直接ダウンロードできます。上の Python コード例で data/raw/SSDSE-B-2026.csv としているのが、まさにこれです。

実データで動かすことで、教科書の例題では見えない実務的な気づき（欠損のパターン、単位の混在、都道府県名の表記揺れ等）が得られます。

🔧 よくあるトラブルと対処

🐍 Python コードが動かない

→ Python 3.10+ と必要ライブラリ（pandas、 numpy、 scikit-learn 等）がインストール済みか確認。 pip install pandas numpy scikit-learn matplotlib で揃います。

📁 CSVファイルが読み込めない

→ ファイルパスを確認。文字コードが utf-8 ではなく shift_jis や cp932 の場合がある（古い日本の公的統計に多い）。 encoding='cp932' を試してください。

📐 数式が表示されない

→ ページが KaTeX を読み込んでいるはずです。ブラウザのキャッシュをクリアするか、開発者ツールで JavaScript エラーを確認。

🔢 数値計算結果が教科書と違う

→ 不偏推定（n-1）と標本推定（n）の違い、浮動小数点誤差、ライブラリのデフォルト引数の違いなどが原因。ドキュメントを確認。

📊 グラフが描画されない

→ Jupyter Notebook なら %matplotlib inline、スクリプト実行なら plt.show() を忘れずに。日本語フォントは matplotlib 用に別途設定（japanize-matplotlib 等）が必要。

📚 さらに学ぶための資料

第1種の過誤 をさらに深く学ぶための代表的リソース：

公的データ：e-Stat（政府統計の総合窓口）、 SSDSE（教育用標準データセット）、 RESAS（地域経済分析システム）
教科書（日本語）：「データ解析のための統計モデリング入門」「統計学入門」「Python ではじめる機械学習」など、入門〜中級書が豊富
教科書（英語）：『The Elements of Statistical Learning』『Pattern Recognition and Machine Learning』『Deep Learning』など標準テキスト
オンライン講座：Coursera、 edX、 Kaggle Learn、統計検定の公式問題集
論文：Google Scholar / arXiv で Type I Error を検索 → 引用数の多い基礎論文から
コミュニティ：Kaggle、 SIGNATE、 Cross Validated（Stack Exchange）、日本統計学会

🎓 学習達成度の自己チェック

次の問いに自分の言葉で答えられるか、試してみてください：

第1種の過誤 を、 30秒で他人に説明できますか？
この概念が使える場面と使えない場面を例で挙げられますか？
上の数式の各記号の意味を口頭で説明できますか？
「落とし穴」セクションで挙げた失敗パターンを、自分の言葉で言い換えられますか？
Python コードを少し変えて、別のデータや条件で動かしてみましたか？
関連用語との違いを1つ以上指摘できますか？
この概念を使った分析結果を、レポートに正しい形式で書けそうですか？

7問中5問以上「はい」と答えられれば、この用語は 使えるレベル で理解できています。残りは関連用語を学ぶ中で自然に補完されます。

📚 Round 18 — 第一種の誤り (Type I error) 完全攻略補足

α第一種偽陽性有意水準BonferroniFDRSSDSE-B-2026多重比較再現性

🔬 数式を言葉で読み解く（拡張 narration）

🔬 記号 → 意味（narration）:

A1101 → 総人口（千人）。分析の分母になる基本量です。
A1301 → 65 歳以上人口。高齢化率を産む分子。
A1201 → 15 〜 64 歳人口（生産年齢人口）。経済活動の主体。
μ → 全国平均。 比較基準として用います。
α → 有意水準。 第一種の誤り許容率（第一種の誤り (Type I error) に関する判断で重要）。
p → p 値。 H₀ の下でデータがどれだけ稀かを示す。

📐 補足の数式と読み解き

基本量の関係を、記号 → 意味で整理します。任意の比率は

$$\text{比率} = \frac{\text{分子}}{\text{分母}} \times 100\quad\text{単位: }\%$$

記号 → 意味:

分子 → SSDSE では A1301（65歳以上人口）
分母 → SSDSE では A1101（総人口）
×100 → 単位を「割合（小数）」から「%」に変える

平均と分散は

$$\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i,\quad s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2$$

t 統計量・効果量は

$$t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_1^2/n_1 + s_2^2/n_2}},\quad d = \frac{\bar{x}_1 - \bar{x}_2}{s_{\text{pooled}}}$$

🧮 実値で計算してみる — SSDSE-B-2026 47 都道府県

SSDSE-B-2026 の都道府県データから第一種の誤り (Type I error) の文脈で代表値を読み取ります。各列の記号 → 意味を確認し、平均・中央値・四分位を併記する習慣を身につけましょう。

都道府県	総人口(千)	65歳以上人口(千)	高齢化率(%)	記号 → 意味
秋田県	945	370	39.1	A1101 → 総人口 / A1301 → 高齢者 / 比率 → 高齢化率
東京都	14,047	3,193	22.7	巨大分母 → 平均を引き上げる外れ値の典型
沖縄県	1,467	323	22.0	若い人口構造 → 全国最低の高齢化率
大阪府	8,838	2,420	27.4	大都市圏の中位 → 比較基準として有用
島根県	658	231	35.1	人口減少地域 → 分母縮小型の高齢化

🐍 Python 実装 — Round 18 拡張

47 都道府県の高齢化率を全国平均と比較した複数 t 検定

🎯 SSDSE-B-2026（都道府県データ）を第一種の誤り (Type I error) の文脈で読み解く実値計算例。各セルの記号 → 意味（A1101 → 総人口, A1301 → 65 歳以上人口）を確認しながら手元の Jupyter で実行できます。

import pandas as pd
from scipy import stats
df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='utf-8', skiprows=1)
df['aging'] = df['A1301']/df['A1101']*100
mu = df['aging'].mean()
pvals = []
for _, row in df.iterrows():
    t, p = stats.ttest_1samp([row['aging']], mu)
    pvals.append(p)
print('生 p<0.05 数:', sum(p<0.05 for p in pvals))

📥 入力: data/raw/SSDSE-B-2026.csv（47 都道府県 × 主要統計列）。出力例は数値・p 値・統計量で、解釈には「実値で計算してみる → 仮説検定 → 効果量 → 結論」の流れを推奨します。

Bonferroni 補正

alpha = 0.05; k = len(pvals)
bonf = alpha / k
print(f'補正後 α each={bonf:.5f}')
print('Bonf 後 有意:', sum(p<bonf for p in pvals))

Holm-Bonferroni 補正

from statsmodels.stats.multitest import multipletests
rej, padj, _, _ = multipletests(pvals, alpha=0.05, method='holm')
print('Holm 棄却数:', rej.sum())

Benjamini-Hochberg (FDR)

rej, padj, _, _ = multipletests(pvals, alpha=0.05, method='fdr_bh')
print('BH 棄却数:', rej.sum())

❓ よくある質問 (FAQ)

α = 0.05 はなぜ広まった？

Fisher が 1925 年に「便宜的な閾値」として推奨したことが起源。厳密な絶対基準ではありません。

第一種と第二種、どちらが深刻？

領域依存です。医薬の有効性検証では α 抑制が優先、がん検診では β（偽陰性）抑制が優先など。

多重検定で α が膨らむとは？

k 個の独立検定で family-wise α は 1−(1−α)^k。 5 検定で約 0.226 になります。

Bonferroni 補正の式は？

α_each = α_family / k。シンプルですが保守的。 Holm-Bonferroni は段階的で僅かに強力。

FDR とは？

False Discovery Rate。棄却した中の偽陽性比率。 Benjamini-Hochberg 法が有名。

⚠️ 拡張版落とし穴チェックリスト

分母を確認しない罠: 比率や率の意味は分母で決まります。 SSDSE で「per 1000」と「per 100」を取り違えると桁違いになります。
外れ値の影響: 東京都が平均値を引き上げる効果は実際に大きく、中央値との乖離を必ず併記しましょう。
因果と相関の混同: 高齢化率と平均所得が相関しても、因果は別問題。第三変数（産業構造・気候）の介在を疑います。
選択バイアス: 「都市部のサンプルだけ」では地方の構造が見えません。 47 都道府県すべてを観察しましょう。
多重比較: 47 都道府県を一斉比較すると α=0.05 でも約 2.35 件は偶然有意。 Bonferroni 等の補正が必須です。
時点ずれ: SSDSE-B-2026 と国勢調査 2020 では基準時点が異なります。同期した比較が必要。
第一種の誤り (Type I error) 特有の文脈ずれ: 教育用に正規化したサンプルと現場データの落差。単位・桁・カテゴリを揃える前処理が肝心。

🔗 関連用語（前提・並列・発展）— Round 18 補強

第一種の誤り (Type I error) を中心に、前提概念・並列分野・発展手法へリンクします。

🔗 仮説検定 🔗 p 値 🔗 帰無仮説 🔗 対立仮説 🔗 多重比較 🔗 サンプルサイズ 🔗 効果量 🔗 t 検定 🔗 t 検定（複）🔗 ANOVA 🔗 正規性 🔗 カイ二乗

📚 関連グループ教材

グループ教材から第一種の誤り (Type I error) の文脈に直結する論文・ハンズオンを辿れます。

論文一覧トップ — 159 編の論文教材から関連分野を辿る
用語集トップ — 537 語の用語ネットワーク
概念マップ — 上位概念・並列概念の可視化

🕰 歴史的背景と現代

第一種の誤り (Type I error) は古典統計と社会データの交差点で発達してきました。 19 世紀末から 20 世紀初頭にかけて Pearson, Fisher, Neyman などが基礎を整え、戦後の公的統計整備により実務応用が広がりました。

2010 年代以降は、「再現性危機」「ビッグデータ」「AI 倫理」の三つの波が第一種の誤り (Type I error) に新しい意味を与えました。単に p<0.05 を出すのではなく、効果量・信頼区間・事前登録・データシートが必須となっています。

日本では総務省統計局・国立社会保障人口問題研究所・経済産業省 RESAS などが公的統計を整備し、教育用に SSDSE が無償公開されました。本ページもこの枠組みで第一種の誤り (Type I error) を扱います。

📚 参考リンク

総務省統計局 e-Stat https://www.e-stat.go.jp/
SSDSE 公開ページ https://www.nstac.go.jp/use/literacy/ssdse/
scipy.stats 公式ドキュメント https://docs.scipy.org/doc/scipy/reference/stats.html
statsmodels 公式 https://www.statsmodels.org/
JIS Q 38507 / ISO/IEC 22989（AI 用語）
OECD Principles on AI（2019）

🌐 関連手法・派生（広域マップ）

同じカテゴリの手法、上位概念、派生分野へのリンクを補強します。

🔖 キーワード索引

💡 30秒で分かる結論 — 第1種の過誤

📍 あなたが今見ているもの

🎨 直感で掴む — 第1種の過誤とは何者か

📐 数式・定義

🔬 数式・定義を「言葉」で読み解く

🧮 SSDSE-B 実値で計算してみる

🐍 Python 実装

① 基本パターン（読み込み・確認・主要列抽出）

② 可視化テンプレ（matplotlib / seaborn）

③ 前処理：欠損・外れ値・型変換

④ 検定・推定の最小例（scipy.stats）

⚠️ よくある落とし穴（7 件）

🧭 詳細解説 — 第1種の過誤 を一段深く掘り下げる

歴史的背景

国際的な位置付け

日本の文脈での意味

よく混同される概念

学習・教材としての位置付け

参考文献・標準

🌐 関連手法・派生

🔗 関連用語（前提・並列・発展）

📘 前提（先に理解しておきたい）

📗 並列（同じ階層の関連用語）

📕 発展（一歩進んだ応用・拡張）

📑 論文・実務での登場パターン

📚 関連グループ教材（全体像）

✅ 第1種の過誤 自己チェックリスト

❓ よくある質問（FAQ）

📌 早見表 — 第1種の過誤

🔖 キーワード索引

💡 30秒で分かる結論

📍 あなたが今見ているもの

🎨 直感で掴む

📐 定義／数式

🔬 記号・用語の読み解き

🧮 実値で計算してみる

🐍 Python での実装例

⚠️ よくある落とし穴

🌐 関連手法・派生・バリエーション

🔗 関連用語（前提・並列・発展）

📖 もう一歩深く — 背景と位置づけ

🎯 主なユースケース

📝 レポート・論文での報告

✅ 学習・分析チェックリスト

🔄 おすすめの学習ステップ

🔍 よくある質問

🧭 用語の位置づけマップ

🔬 詳細な解説（深掘り）

概念の本質

他の概念との関係

実務で気をつけるポイント

📊 評価・検証の視点

💼 業界別の使われ方

📈 公的統計データ（SSDSE）での具体例

🔧 よくあるトラブルと対処

📚 さらに学ぶための資料

🎓 学習達成度の自己チェック

📚 関連グループ教材

📚 Round 18 — 第一種の誤り (Type I error) 完全攻略補足

🔬 数式を言葉で読み解く（拡張 narration）

📐 補足の数式と読み解き

🧮 実値で計算してみる — SSDSE-B-2026 47 都道府県

🐍 Python 実装 — Round 18 拡張

47 都道府県の高齢化率を全国平均と比較した複数 t 検定

Bonferroni 補正

Holm-Bonferroni 補正

Benjamini-Hochberg (FDR)

❓ よくある質問 (FAQ)

⚠️ 拡張版 落とし穴チェックリスト

🔗 関連用語（前提・並列・発展）— Round 18 補強

📚 関連グループ教材

🕰 歴史的背景と現代

📚 参考リンク

🌐 関連手法・派生（広域マップ）

🧭 詳細解説 — 第1種の過誤を一段深く掘り下げる

✅ 第1種の過誤自己チェックリスト

⚠️ 拡張版落とし穴チェックリスト