独立行政法人統計センター主催 統計データ分析コンペティションの受賞論文を、 実データ・Pythonコードとともに教育用に再現したものです。 各ページではデータの取得方法・統計手法・分析コードを学べます。
従来の「教科書を最初から順番に読む」スタイルではなく、 「実際の論文という “完成形” を最初に見て、 分からない用語が出てきた瞬間に、 その用語の解説を必要なだけ学ぶ」という逆方向の学習設計です。
論文内の 専門用語をクリックすると、 数式・直感図・誤解の罠まで詰まったポップアップが開きます。 「使う場面と知識を同時に学ぶ」ので、 動機が途切れず、 何より忘れにくい。 教育心理学のProblem-Based Learning や Just-in-Time Teaching の流れを汲む設計です。
統計データ分析コンペの受賞論文を「教材」として再構成したサイトです。 各論文ページは、初心者でも分析の流れを追えるように、以下の9つのセクションで構成されています。
🔬 完全再現可能: 各論文には Python スクリプトが付属しています。
SSDSE データを data/raw/ に置くだけでコードを編集せず実行できます。
合成データは一切使っていません(全て実データ)。
何から読めばいいか迷ったら、以下の順番で読み進めるのがおすすめです。
LASSO や Random Forest で「効く変数」を発見。
※ 下の「タグで絞り込む」を使うと、手法やデータごとに論文を一覧できます。
| 年度 | 論文数 | 公開済み | 状況 |
|---|---|---|---|
| 2025年度 | 19 | 19 (100%) | 完了 |
| 2024年度 | 20 | 20 (100%) | 完了 |
| 2023年度 | 20 | 20 (100%) | 完了 |
| 2022年度 | 40 | 40 (100%) | 完了 |
| 2021年度 | 19 | 19 (100%) | 完了 |
| 2020年度 | 19 | 19 (100%) | 完了 |
| 2019年度 | 14 | 14 (100%) | 完了 |
| 2018年度 | 8 | 8 (100%) | 完了 |
data/raw/ フォルダに配置してからコードを実行してください。