제주대학교 Repository

증가하는 데이터베이스에 대한 다중 최소 임계치 기반 정규 패턴 마이닝

Metadata Downloads
Abstract
기존의 전통적인 빈발 패턴 마이닝은 전체 트랜잭션 데이터베이스에 대하여 단일 최소 임계치를 기반으로 빈발 패턴을 마이닝한다. 단일 최소 임계치를 이용하는 방법은 아이템에 동일한 임계치가 적용되어 레어 아이템 문제(rare item problem)를 유발시킨다. 한편, 일정 주기마다 발생하는 패턴을 정규 패턴(regular pattern)이라고 한다. 실세계에서는 빈발한 패턴뿐만 아니라 점진적으로 증가하는 데이터 내에서 주기적으로 발생하는 패턴정보 처리의 중요성이 증가하고 있다. 본 논문은 레어 아이템 문제를 해결하고 정규 패턴을 마이닝하는 기법을 제안한다.
Previous traditional frequent pattern mining methods discover all of the frequent patterns with a single minimum threshold for the whole database. By using the single threshold, they suffer from the rare item problem due to setting the same minimum support for all items. In real world applications, the significance of processing patterns that occur regularly in incremental database is increasing as well as the frequent patterns. In this paper, we propose a method that can be applied for regular pattern mining and also solve the rare item problem.
Author(s)
최형길
Issued Date
2014
Awarded Date
2014. 2
Type
Dissertation
URI
http://dcoll.jejunu.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000006660
Alternative Author(s)
Choi, Hyong Gil
Affiliation
제주대학교 대학원
Department
대학원 컴퓨터공학과
Advisor
이상준
Table Of Contents
I. 서 론 1
Ⅱ. 관련연구 4
2.1. Apriori 3
2.2 MSApriori 6
2.3. FP-Growth 7
2.4. CFP-Growth 10
2.5. CFP-Growth++ 11
2.6. 정규 패턴 마이닝 12
Ⅲ. 제안하는 마이닝 기법 14
3.1. RMIS-Tree 구성 14
3.2. RMIS-Tree 구축 16
3.3. RMIS-Tree의 증가된 트랜잭션 삽입 21
3.4. 정규 패턴 마이닝 22
Ⅳ. 성능 평가 25
4.1. 실험 환경 및 실험 데이터 28
4.2. 성능 평가 실험 26
4.2.1 Chess 데이터 셋에 대한 성능 평가 실험 결과 28
4.2.2 Mushroom 데이터 셋에 대한 성능 평가 실험 결과 29
4.2.3 T10I4D100K 데이터 셋에 대한 성능 평가 실험 결과 31
4.2.4 Retail 데이터 셋에 대한 성능 평가 실험 결과 33
Ⅴ. 결론 37
참고문헌 38
Degree
Master
Publisher
제주대학교 대학원
Citation
최형길. (2014). 증가하는 데이터베이스에 대한 다중 최소 임계치 기반 정규 패턴 마이닝
Appears in Collections:
General Graduate School > Computer Engineering
공개 및 라이선스
  • 공개 구분공개
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.