HYU/๋ฐ์ดํฐ์ฌ์ด์ธ์ค12 3. Apriori Scalable Mining Method ์ค ํ๋ Scale down์ ํ๋ฉด์ Frequent Pattern์ ์ฐพ๋ Method ์ค ํ๋ Apriori Candidate Generation and Test Approach Apriori์์ Scaledown์ ํ๋ ์๋ฆฌ๋ Infrequentํ Pattern์ด ์๋ค๋ฉด, ํด๋น ํจํด์ Superset์ ์ ๋ Frequentํ ์๊ฐ ์๋ค๋ ๊ฒ์ ์ด์ฉ Downward property ์ด์ฉ ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ๊ตณ์ด Generationํ๊ณ Testํ ํ์๊ฐ ์๋ค ์ฒดํฌํด์ผ ํ ํจํด์ ์๋ฅผ ์ค์ฌ์ค๋ค ๋ฐฉ๋ฒ์ ๊ฐ๋ตํ๊ฒ ๋ณด๋ฉด 1. DB๋ฅผ ์ค์บํด์ ํฌ๊ธฐ๊ฐ 1์ธ Frequent Pattern๋ค์ ์ฐพ๋๋ค 2. ์๋์ ๊ณผ์ ์ ๊ณ์ํด์ ๋ฐ๋ณตํ๋ค 2-1. ๊ธธ์ด๊ฐ K์ธ Frequent Patt.. 2024. 4. 13. 2. Frequent Patterns Mining Frequent Patterns, Association and Correlatons Frequent Pattern Mining ๋ฐ์ดํฐ ์์์ ์์ฃผ ๋ฑ์ฅํ๋ ํจํด์ ๋ถ์ํ๋ ๊ธฐ์ Frequent Pattern? : ๋ฐ์ดํฐ์ ๋ด์์ ์์ฃผ ๋ฑ์ฅํ๋ ํจํด ์๋ฅผ ๋ค๋ฉด, ์์ฃผ ํจ๊ป ๊ตฌ๋งค๋๋ ์ํ๋ค Motivation? ๋ฐ์ดํฐ ์์ ๋ด์ฌ๋ ํจํด๋ค ์ฐพ๊ธฐ ์ํจ ์ด๋ค ์ํ๋ค์ด ํจ๊ป ๊ตฌ๋งค๊ฐ ๋๋๊ฐ? (์ด๊ฒ ์์ผ๋ก ์ฃผ๋ก ๋ค๋ค์ง ์์) Beers and Diapers ๊ธฐ์ ๊ท์ ๋งฅ์ฃผ๋ ํจ๊ป ๊ตฌ๋งค๊ฐ ๋๋ ๊ฒฝํฅ์ด ์๋ค ์ด ์ ๋ณด๋ฅผ ์๋ฉด ๊ธฐ์ ๊ท์ ๋งฅ์ฃผ๋ฅผ ํจ๊ป ๋น์นํ๋ฉด ํ๋งค์จ์ด ์ฌ๋ผ๊ฐ ๊ฒ ํน์ ์ํ์ ๊ตฌ๋งคํ ๋ค์ ์์ฐจ์ ์ผ๋ก ์ด๋ค ๊ฒ์ ๊ตฌ๋งคํ๋ ๊ฒฝํฅ์ด ์๋๊ฐ? ๋์งํธ ์นด๋ฉ๋ผ๋ฅผ ๊ตฌ๋งคํ ํ์ ์ผ๋ง์๋ค๊ฐ SD์นด๋(๋ฉ๋ชจ๋ฆฌ)๋ฅผ ๊ตฌ๋งคํ๋.. 2024. 4. 13. 1. Introduction What is Data Mining? ๋ฐ์ดํฐ ๋ง์ด๋์ด๋ ๋ฌด์์ผ๊น ๋๋์ ๋ฐ์ดํฐ ์์์ ํฅ๋ฏธ๋กญ๊ณ ์ค์ํ ๋ฐ์ดํฐ๋ฅผ ์๋์ผ๋ก ๋ฝ์๋ด๋ ๊ณผ์ ์ด๋ค ๋ฐ์ดํฐ๊ฐ ํฅ๋ฏธ๋กญ๊ณ ์ค์? Non-trivial, Implicit, Previously unknown, Potentially usefull ,,, ํ ์ ๋ณด๋ค ์์ฆ ์ฐ๋ฆฌ๋ ๋๋์ ๋ฐ์ดํฐ ์๋์ ์ด๊ณ ์๊ณ , ๋ฐ์ดํฐ๋ ๊ณ์ํด์ ์์ฌ๊ฐ๊ธฐ ๋๋ฌธ์ ๊ทธ ์์์ ์ค์ํ ์๋ฏธ๋ฅผ ์ฐพ์์ผ ํ๋ค Knowledge Discovery Process ๋๋์ ๋ฐ์ดํฐ ์์์ ์๋ฏธ์๋ ์ ๋ณด๋ฅผ ์ฐพ์๋ด๋ ๊ณผ์ Data Cleaning ๋ฐ์ดํฐ์ ์์ฌ์๋ ๋ ธ์ด์ฆ, ์๋ฌ ๋ฑ์ ์ ๊ฑฐํ๋ ๊ณผ์ Data Warehouse ๋๋์ ๋ฐ์ดํฐ๋ค์ด ์ ์ฅ๋ ์ ์ฅ์ Task-relevant Data ํ์ฌ ์งํํ๊ณ ์๋ Task.. 2024. 4. 13. ์ด์ 1 2 ๋ค์