💡 30秒で分かる結論
数値で表され、 演算が意味を持つ変数
🎨 直感で掴む
この指標はデータの性質を要約するためのものです。 散布図・ヒストグラム等の可視化とセットで読み解きましょう。
本ページでは 量的変数 を、 定義・前提条件・使い方・落とし穴の順に整理して解説します。 厳密な定義より、 まず何を、 いつ、 どう使うかを理解することを優先してください。
📐 定義
数値で表され、 演算が意味を持つ変数
英語名 Quantitative Variable。
🎯 いつ・どこで使うか
- 「基礎統計」分野の標準的な道具として、 多くの分析で登場します。
- 📚 代表値(平均・中央値・最頻値) を学ぶときに必ず通過する基本概念です。
- 論文・実務レポートで頻出する用語なので、 1 度はちゃんと理解しておくと後が楽です。
📋 前提条件・適用範囲
この用語を理解・使用するときは、 次のような前提を意識してください:
- データの性質:尺度(名義/順序/間隔/比例)と分布を確認
- サンプル数:手法によって最低限のサンプル数が異なります
- 独立性:観測が独立であるかを確認(時系列・パネル等では別の手法が必要)
- 欠損・外れ値:前処理の方針を明確に
⚠️ よくある落とし穴
❌ 外れ値の影響
平均は外れ値に弱い。 中央値・IQR と組み合わせて確認。
❌ 単位を忘れない
数値は単位とセット。 「3」だけでは意味を持ちません。
❌ 集約レベルに注意
同じデータでも集計の単位を変えると傾向が逆転することがあります(シンプソン)。
🐍 Python での扱い
SSDSE-B-2026 のような公的統計データを Python で扱う際の基本パターン:
1
2
3
4
5
6
7
8
9
10
11
12 | import pandas as pd
import numpy as np
# データ読み込み
df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='utf-8', skiprows=1)
print(df.shape)
print(df.dtypes)
print(df.describe())
# 「量的変数」の文脈で扱う場合の例:
# 分野: 基礎統計
# 関連手法は同カテゴリの他用語を参照してください。
|
具体的なコードは 代表値(平均・中央値・最頻値) を参照してください。
📝 レポートでの報告
分析結果を報告するときに含めるべき情報:
- 使ったデータ:出典・期間・サンプル数
- 適用条件の確認:前提が満たされているか
- 計算結果:数値だけでなく不確実性(CI・SE)も
- 解釈:何を意味するか、 何を意味しないか
- 限界:適用範囲外への拡張は避ける
✅ チェックリスト
- □ 「量的変数」を使う場面か再確認したか
- □ データの尺度・分布・サンプル数を確認したか
- □ 前提条件を満たしているか
- □ 計算した値だけでなく不確実性も把握したか
- □ 解釈と限界を区別したか
- □ 関連グループ教材で全体像を確認したか