Rule์ ๊ธฐ๋ฐํ ๋ถ๋ฅ๊ธฐ
- ๊ธฐ๋ณธ์ ์ธ ์์ด๋์ด๋
IF-THEN
์ ์ฌ์ฉํ๋ ๊ฒ- Ex)
IF age = youth AND student = false THEN buys_computer = no
- Ex)
- ๋ฐ์ดํฐ์ ์๊ฐ ๊ทธ๋ ๊ฒ ๋ง์ง ์์ ๊ฒฝ์ฐ์ ์ฌ์ฉํ ์ ์๋ค
- ์ด Rule๋ค์ Domain Experts (Human Experts)์ ์ํด์ ๋ง๋ค์ด์ง๋ค
- ํน์ ๋ฐ์ดํฐ๊ฐ ์ฌ๋ฌ ๊ฐ์ Rule์ ๋ถํฉํ๋ ๊ฒฝ์ฐ์๋ Conflict Resolution์ด ํ์ํ๋ค
- Size Ordering
- Rule์ Size๋ผ๋ ๊ฒ์ IF๋ฌธ์ ๊ฑธ๋ ค์๋ Feature์ ์
- ์ฆ, Size๊ฐ ํฌ๋ค๋ ๊ฒ์ Rule์ด ๊ตฌ์ฒด์ ์ด๊ณ Toughest ํ๋ค๋ ๊ฒ์ด๋ค
- Size๊ฐ ํฐ Rule์ผ์๋ก ๋ ๋์ ์ฐ์ ์์๋ฅผ ์ฃผ๋ ๋ฐฉ์
- Class-based Ordering
- Misclassification cost๊ฐ ๋ฎ์ Rule์ ์ ํํ๋ ๋ฐฉ์
- Rule-based Ordering
- Rule์ ๋ํ ์ฐ์ ์์๋ฅผ ๋ฏธ๋ฆฌ ์ ํด๋ List๋ฅผ ๊ฐ์ง๊ณ ํ๋จํ๋ ๋ฐฉ์
- ๊ฐ Rule์ ๋ํ ์ฐ์ ์์ ์ญ์ Domain Experts๊ฐ ์ ํ๋ค
- Size Ordering
Rule Extraction from a Decision Tree
Decision Tree๊ฐ ์ฌ์ค Rule-based๋ผ๊ณ ๋ณผ ์ ์๋ค
- Deicision Tree์ ๊ฐ Path๋ฅผ Rule๋ก ๋ณ๊ฒฝ ํ๋ฉด ๋๋ค
- Rule์ ๊ฑฐ๋ํ ํธ๋ฆฌ๋ณด๋ค ์ดํดํ๊ธฐ๊ฐ ์ฝ๋ค
- ๋ฃจํธ๋ถํฐ ๋ฆฌํ๋
ธ๋๊น์ง์ Path ๊ฐ๊ฐ์ ํ๋์ Rule๋ก ์ ์ํ๋ค
- Path ์์ ์๋ Feature-Value ์์ ๊ฐ๊ฐ Rule์์ ํ๋์ ์ ์์ฌ๋ฅผ ํ์ฑํ๋ค
- ๋ฆฌํ๋ ธ๋๋ ์ต์ข ์ ์ธ Class Prediction์ ์๋ฏธํ๋ค
- Ex) age <= 30 AND
- Decision Tree๋ก๋ถํฐ Rule์ ์ถ์ถํ๋ฉด, Rule๊ฐ์ Conflict๊ฐ ๋ฐ์ํ์ง ์๋๋ค (Mutually Exclusive)
- Decision Tree์์ ๋ด๋ ค๊ฐ ๋, ์ฌ๋ฌ ๊ฐ์ Branch์ ๊ฑธ์น๋ ๊ฒฝ์ฐ๋ ์๊ธฐ ๋๋ฌธ ์
Rule Extraction from Association Rule Mining
Association Rule Mining ์ ๊ธฐ๋ฐ์ผ๋ก Rule์ ์์ฑ
- Associative Classification์ผ๋ก๋ ๋ถ๋ฆฐ๋ค
- Frequent Pattern Mining์ ๊ธฐ๋ฐ์ผ๋ก Rule์ ์์ฑํ๋ค
- min_sup, min_conf ๊ฐ์ ์กฐ์ ํด์, Feature-Value(Condition)๊ณผ Class(Prediction) ์ฌ์ด์ ๊ฐ๋ ฅํ ์ฐ๊ด๊ด๊ณ๋ฅผ ์ฐพ์ ์๋ ์๋ค
- ๋์ Support, Confidence ๊ฐ์ ๊ฐ๋ ์ฐ๊ด๊ด๊ณ๋ ๊ฐ๋ ฅํ ์ฐ๊ด๊ด๊ณ
- Rule๋ค์ Mutually Exclusiveํ์ง ์๊ธฐ ๋๋ฌธ์ Conflict Resolution์ด ํ์ ํ๋ค
- Benefits and Limits
- min_conf ๊ฐ์ ๋๊ฒ ์ก์ผ๋ฉด, ๋ง์กฑํ๋ Frequent Pattern์ ์๊ฐ ์ค์ด๋ค ๊ฒ์ด๊ธฐ ๋๋ฌธ์ Rule์ ์๊ฐ ์ค์ด๋ค๊ฒ ๋์ด Conflict๊ฐ ๊ฐ์ํ๊ฒ ๋๋ค
- ๊ทธ๋ ์ง๋ง ๊ทธ๋ด ๊ฒฝ์ฐ์๋ Coverage๊ฐ ๋ฎ์์ง๋ ๋ฌธ์ ๊ฐ ์๋ค
Coverage and Accuracy of a Rule R
Rule R์ Coverage์ Accuracy
- Cover๋ฅผ ํ๋ค๊ณ ํด์ ๋ฐ๋์ ์ ํํ ๋ถ๋ฅ๋๋ ๊ฒ์ ์๋๋ค
- Coverage๋ ์ ์ฒด ๋ฐ์ดํฐ ์ค์ ์ผ๋ง๋ ๋ง์ ๋ฐ์ดํฐ๊ฐ R์ ์ํด์ ํ๋ณ์ด ๋ ์ ์๋์ง
- Accuray๋ R์ด ์ผ๋ง๋ ์ ํํ๊ฒ ๋ถ๋ฅ๋ฅผ ํ๋์ง
Lazy vs Eager Learning
Lazy Learning๊ณผ Eager Learning์ ์ฐจ์ด๋ฅผ ์์๋ณด์
- Eager Learing
- ์ฃผ์ด์ง Training Data๋ฅผ ๊ฐ์ง๊ณ ๋ฏธ๋ฆฌ Classification Model์ ํ์ต ์์ผ๋๋ค
- ๊ทธ๋ฆฌ๊ณ Test Data๊ฐ ๋ค์ด์ค๋ฉด, ํด๋น ๋ชจ๋ธ์ ํตํด์ ๋ถ๋ฅ๋ฅผ ํ๋ค
- ๋ฏธ๋ฆฌ ๋ชจ๋ธ์ ๋ง๋ค์ด๋๊ณ ํด๋น ๋ชจ๋ธ์ ํตํด ์์ธก ์ ํ๊ธฐ ๋๋ฌธ์ Eagerํ๋ค๊ณ ํ๋ค
- Machine Learning์ ์ ํ์ ์ธ ๋ฐฉ์
- Ex) Decision Tree
- Lazy Learning
- Test Data๊ฐ ๋ค์ด์ค๊ธฐ ์ ๊น์ง๋ ์๋ฌด๊ฒ๋ ํ์ง ์๋๋ค
- Training Data๋ฅผ ๋จ์ง ์ ์ฅ๋ง ํ๊ณ ์๋๋ค
- Test Data๊ฐ ๋ค์ด์ค๋ฉด, Training Data๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ถ๋ฅํ๋ค
- Training์๋ ์๊ฐ์ด ๋ณ๋ก ์์๋์ง ์์ง๋ง, ์์ธก์ ํ๋๋ฐ ๋ง์ ์๊ฐ ์ด ๊ฑธ๋ฆฐ๋ค
- Ex) KNN Algorithm
K-Nearest Neighbor(KNN) Algorithm
๋ํ์ ์ธ Lazy Learning ๋ฐฉ์์ธ KNN ์๊ณ ๋ฆฌ์ฆ์ ๋ํด ์์๋ณด์
- ์์ ์์๋
K = 5
์ธ ๊ฒฝ์ฐ์ด๋ค - ๋ชจ๋ ๋ฐ์ดํฐ๋ N์ฐจ์ ์์์ ๋ํ๋ด์ง๋ค (N์ Data์ Feature์ ์)
- ๋ ๋ฐ์ดํฐ ์ฌ์ด์ ๊ฑฐ๋ฆฌ(dist(X1, X2))๋ ๊ณต๊ฐ์์์ ์ ์๋๋ค
- ์ด๋ dist function์ ์ด๋ค ๊ฒ์ ์ฌ์ฉํด๋ ์๊ด์๋ค
- Ex) Euclidean, Manhattan, ...
- Test Data์ ๊ฐ์ฅ ๊ฐ๊น์ด K๊ฐ์ ์ด์๋ค์ Class Label์ ๋ณด๊ณ , ๋ ๋ง์์ชฝ์ผ๋ก ์์ธก (
Voting
)- Majority Voting (๋ค์๊ฒฐ)
- ์์ ์์์์๋ 5๊ฐ์ ์ด์๋ค ์ค์ - ๊ฐ ๋ ๋ง๊ธฐ ๋๋ฌธ์ - ๋ก ๋ถ๋ฅํ๋ค
- ๊ทธ๋ฐ๋ฐ K๊ฐ์ ๋ฐ์ดํฐ ์ค์์๋ ๋ ๊ฐ๊น์ด ๋ฐ์ดํฐ๋ค์ด ์กด์ฌํ์ง ์๋๋! ๋ผ๋ ์๊ฐ์ด ๊ฐ๋ฅ
- ๊ทธ๋์ ๋์จ ๋ฐฉ์์ด
Weighted Voting
- K๊ฐ์ ์ด์๋ค์ ๋ํด์ ๊ฐ์๋ง ์ธ๋ ๊ฒ์ด ์๋๋ผ ์ด์๊ฐ์ ๊ฑฐ๋ฆฌ๋ ๊ณ ๋ คํด์ ํ๋จ
- ๊ทธ๋์ ๋์จ ๋ฐฉ์์ด
728x90
'HYU > ๋ฐ์ดํฐ์ฌ์ด์ธ์ค' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
12. Evaluation & Ensemble (0) | 2024.04.16 |
---|---|
10. Overfitting (0) | 2024.04.14 |
9. Decision Tree (0) | 2024.04.13 |
8. Classification (0) | 2024.04.13 |
7. Association Rules (0) | 2024.04.13 |