別名・略称:(なし)
間隔尺度(Interval Scale):差に意味があるが原点が任意の尺度(気温℃など)
| 尺度 | 例 | 演算 | 統計量 |
|---|---|---|---|
| 名義 | 血液型、 性別 | =, ≠ | 最頻値、 度数 |
| 順序 | 5段階評価、 ランキング | =, ≠, <, > | 中央値、 順位相関 |
| 間隔 | 摂氏温度、 西暦、 IQ | + + - | 平均、 標準偏差、 Pearson相関 |
| 比例 | 身長、 体重、 所得、 ケルビン温度 | 全演算 | 幾何平均、 変動係数 |
間隔尺度の特徴を式で表現すると:
SSDSE データの変数を尺度で分類:
| 変数 | 尺度 |
|---|---|
| 都道府県名 | 名義尺度 |
| 年度 | 間隔尺度 |
| 消費支出(円) | 比例尺度 |
| 高齢化率(%) | 比例尺度 |
SSDSE-B-2026(47 都道府県・2023 年データ)を題材にした最小コード:
1 2 3 4 5 6 7 8 9 10 11 | # Pandas には尺度の区別はないが、 自分で意識して扱う import pandas as pd df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='utf-8', skiprows=1) # 間隔尺度(年度)の差は意味があるが比は意味なし print(df['年度'].diff()) # OK # print(df['年度'] / 2020) # 意味なし # カテゴリ変数(名義)として明示 df['都道府県'] = df['都道府県'].astype('category') |