別名・略称:(なし)
集合(Set):要素の集まり。 確率の基礎
UNION, INTERSECT, EXCEPT、 Python の set 型は集合演算そのもの。UNION ALL、 pandas の merge、 機械学習の クラスラベル も集合論で考えられます。 すべての数学・統計の 基礎言語。| 演算 | 記号 | 意味 |
|---|---|---|
| 和集合 | A ∪ B | A または B |
| 積集合 | A ∩ B | A かつ B |
| 差集合 | A \ B | A で B でないもの |
| 補集合 | Aᶜ | A でないもの全部 |
| 部分集合 | A ⊆ B | A の全要素が B にも |
SSDSE データで「東京 OR 大阪のデータを抜き出す」は和集合:
WHERE pref IN ('東京', '大阪')包除原理の使用例:「英語が好きな人 50、 数学が好きな人 30、 両方好き 15」→ 少なくとも 1 教科好き = 50 + 30 - 15 = 65 人
SSDSE-B-2026(47 都道府県・2023 年データ)を題材にした最小コード:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 | # Python の set 型で集合演算 A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} print(A | B) # 和集合 {1,2,3,4,5,6,7,8} print(A & B) # 積集合 {4,5} print(A - B) # 差集合 {1,2,3} print(A ^ B) # 対称差 {1,2,3,6,7,8} # pandas でも集合的操作 import pandas as pd s1 = pd.Series(['a', 'b', 'c']) s2 = pd.Series(['b', 'c', 'd']) print(pd.Index(s1).intersection(pd.Index(s2))) # ['b','c'] |