論文一覧に戻る 📚 用語集トップ 🗺 概念マップ
📚 用語解説
📚 用語解説
データビジュアライゼーション
Data Visualization
可視化
別称: DataViz

🔖 キーワード索引

データビジュアライゼーションData Visualization可視化DataViz

本ページは データビジュアライゼーション(Data Visualization)を多角的に解説します。 上のチップは、 検索・関連語の手がかりです。

💡 30秒で分かる結論

📍 文脈 — どこで使う概念か

データビジュアライゼーション(Data Visualization)は、 統計学・デザイン・認知科学を統合した実学です。 Edward Tufte の古典「The Visual Display of Quantitative Information」(1983)以来、 「データ→図→洞察」の流れがデータサイエンスの中心になりました。 報告・プレゼン・EDA のあらゆる場面で必要。

🎨 直感で掴む — 具体例で理解する

基本グラフの使い分け:

グラフ種類適したデータ
棒グラフカテゴリ vs 数値都道府県別人口
折れ線時系列月別売上推移
散布図2 つの数値変数身長 vs 体重
ヒストグラム数値の分布年齢分布
箱ひげ図分布の比較群別の収入分布
ヒートマップ2 次元の濃淡相関行列、 時間×場所

原則:「シンプルに、 正確に、 美しく」。 デザインは情報伝達の手段で、 装飾ではない。

📐 定義

データを視覚化する技術・デザイン

英語名 Data Visualization、 カテゴリ:可視化。

🔬 記号・要素の読み解き

data-ink ratio
Tufte の概念:「情報を伝えるインク」/「総インク」を最大化
aesthetic mapping
変数を視覚属性(位置、 色、 大きさ)に割り当てる対応
Grammar of Graphics
Wilkinson の理論。 ggplot2 の基盤
Gestalt 原理
近接、 類似、 連続、 閉合などの知覚原理
色覚多様性
色覚バリエーションを考慮(赤緑色弱は人口の 5%)

🧮 数値例・実値計算

悪いグラフ vs 良いグラフ(よくある失敗例):

悪い例問題改善
3D 円グラフ奥行きで面積が歪む2D 棒グラフ
y 軸が 0 から始まらない差を誇張必ず 0 起点 or 注記
多すぎる色意味不明2〜5 色に絞る
凡例が遠い視線移動が多い凡例をデータの隣に
赤緑のみ色覚多様性無視青オレンジ + 形状

🐍 Python 実装例

最小コードで動かしてみる例:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

df = pd.read_csv('data/raw/SSDSE-B-2026.csv', encoding='utf-8', skiprows=1)

# 散布図に回帰直線 + 信頼帯
sns.regplot(data=df, x='高齢化率', y='死亡率')
plt.title('高齢化率 vs 死亡率(47都道府県)')
plt.xlabel('高齢化率 (%)')
plt.ylabel('死亡率 (‰)')
plt.tight_layout()
plt.show()

⚠️ よくある落とし穴

❌ チャートジャンク
装飾過多で情報が見えなくなる。 Tufte の警告通り、 余計な要素を削る。
❌ 軸の操作
y 軸を 0 から始めないと差を誇張できる。 報道・広告で頻発する 嘘グラフ
❌ 情報過多
1 枚に 10 系列以上は読めない。 ファセット分割(小倍数)を使う。
❌ 3D の濫用
見栄え重視で 3D 円グラフ等を使うと、 比較の精度が落ちる。
❌ 色覚多様性無視
赤緑だけで分けると 5% の人に読めない。 形状や濃淡を併用。