기존 k-mode 알고리즘 개선을 통한 범주형 속성 데이터에 대한 효율적인 클러스터링 방법
- Alternative Title
- Effective way of clustering on categorical attribution database through improvement of existing k-mode algorithm
- Abstract
- In recent years, as importance of categorical database has increased, various researches about categorical data are performed. Especially, k-mode algorithm which is partitional methods for categorical data as an idea of extending k-means algorithm shows excellent capability in time efficiency. However, similarity calculation through simple comparison between random-choice and mode about initial points mode shows low accuracy about result of clustering.
In this thesis, the selecting method of initial points, which is not random-choice about initial points but based on frequency of data attribution has been improved. Also accuracy of clustering results has improved by giving weights which it follow in frequency.
- Author(s)
- 오수민
- Issued Date
- 2007
- Awarded Date
- 2007. 2
- Type
- Dissertation
- URI
- http://dcoll.jejunu.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000003902
- Alternative Author(s)
- Oh, Su-Min
- Affiliation
- 제주대학교 대학원
- Department
- 대학원 전산통계학과
- Advisor
- 김철수
- Table Of Contents
- Ⅰ. 서론 = 1
Ⅱ. 데이터 마이닝 = 3
1. 지식발견을 위한 데이터 마이닝 = 3
2. 데이터속성 유형 = 6
3. 클러스터링 기법 = 10
Ⅲ. k-mode 개선 알고리즘 = 14
1. 알고리즘 정리 = 14
1) k-means algorithm = 14
2) k-mode algorithm = 17
3) k-prototype algorithm = 20
2. k-mode 개선 알고리즘 = 22
1) 초기치 k선정 방법 개선 = 22
2) 유사도 계산방식 개선 = 26
3) 속성간 웨이트(r) 적용 = 28
4) 개선된 k-mode 알고리즘 = 29
Ⅳ. 실험결과 및 분석 = 30
1. Database 실험 = 30
1) Soybean Database = 30
2) Mushroom Database = 40
2. 연구 비교 = 46
Ⅴ. 결론 및 제안 = 50
Ⅵ. 참고문헌 = 51
- Degree
- Master
- Publisher
- 제주대학교 대학원
- Citation
- 오수민. (2007). 기존 k-mode 알고리즘 개선을 통한 범주형 속성 데이터에 대한 효율적인 클러스터링 방법
-
Appears in Collections:
- General Graduate School > Computer Science and Statistics
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.