증가하는 데이터베이스에 대한 다중 최소 임계치 기반 정규 패턴 마이닝
- Abstract
- 기존의 전통적인 빈발 패턴 마이닝은 전체 트랜잭션 데이터베이스에 대하여 단일 최소 임계치를 기반으로 빈발 패턴을 마이닝한다. 단일 최소 임계치를 이용하는 방법은 아이템에 동일한 임계치가 적용되어 레어 아이템 문제(rare item problem)를 유발시킨다. 한편, 일정 주기마다 발생하는 패턴을 정규 패턴(regular pattern)이라고 한다. 실세계에서는 빈발한 패턴뿐만 아니라 점진적으로 증가하는 데이터 내에서 주기적으로 발생하는 패턴정보 처리의 중요성이 증가하고 있다. 본 논문은 레어 아이템 문제를 해결하고 정규 패턴을 마이닝하는 기법을 제안한다.
Previous traditional frequent pattern mining methods discover all of the frequent patterns with a single minimum threshold for the whole database. By using the single threshold, they suffer from the rare item problem due to setting the same minimum support for all items. In real world applications, the significance of processing patterns that occur regularly in incremental database is increasing as well as the frequent patterns. In this paper, we propose a method that can be applied for regular pattern mining and also solve the rare item problem.
- Author(s)
- 최형길
- Issued Date
- 2014
- Awarded Date
- 2014. 2
- Type
- Dissertation
- URI
- http://dcoll.jejunu.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000006660
- Alternative Author(s)
- Choi, Hyong Gil
- Affiliation
- 제주대학교 대학원
- Department
- 대학원 컴퓨터공학과
- Advisor
- 이상준
- Table Of Contents
- I. 서 론 1
Ⅱ. 관련연구 4
2.1. Apriori 3
2.2 MSApriori 6
2.3. FP-Growth 7
2.4. CFP-Growth 10
2.5. CFP-Growth++ 11
2.6. 정규 패턴 마이닝 12
Ⅲ. 제안하는 마이닝 기법 14
3.1. RMIS-Tree 구성 14
3.2. RMIS-Tree 구축 16
3.3. RMIS-Tree의 증가된 트랜잭션 삽입 21
3.4. 정규 패턴 마이닝 22
Ⅳ. 성능 평가 25
4.1. 실험 환경 및 실험 데이터 28
4.2. 성능 평가 실험 26
4.2.1 Chess 데이터 셋에 대한 성능 평가 실험 결과 28
4.2.2 Mushroom 데이터 셋에 대한 성능 평가 실험 결과 29
4.2.3 T10I4D100K 데이터 셋에 대한 성능 평가 실험 결과 31
4.2.4 Retail 데이터 셋에 대한 성능 평가 실험 결과 33
Ⅴ. 결론 37
참고문헌 38
- Degree
- Master
- Publisher
- 제주대학교 대학원
- Citation
- 최형길. (2014). 증가하는 데이터베이스에 대한 다중 최소 임계치 기반 정규 패턴 마이닝
-
Appears in Collections:
- General Graduate School > Computer Engineering
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.