제주대학교 Repository

기존 k-mode 알고리즘 개선을 통한 범주형 속성 데이터에 대한 효율적인 클러스터링 방법

Metadata Downloads
Alternative Title
Effective way of clustering on categorical attribution database through improvement of existing k-mode algorithm
Abstract
In recent years, as importance of categorical database has increased, various researches about categorical data are performed. Especially, k-mode algorithm which is partitional methods for categorical data as an idea of extending k-means algorithm shows excellent capability in time efficiency. However, similarity calculation through simple comparison between random-choice and mode about initial points mode shows low accuracy about result of clustering.
In this thesis, the selecting method of initial points, which is not random-choice about initial points but based on frequency of data attribution has been improved. Also accuracy of clustering results has improved by giving weights which it follow in frequency.
Author(s)
오수민
Issued Date
2007
Awarded Date
2007. 2
Type
Dissertation
URI
http://dcoll.jejunu.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000003902
Alternative Author(s)
Oh, Su-Min
Affiliation
제주대학교 대학원
Department
대학원 전산통계학과
Advisor
김철수
Table Of Contents
Ⅰ. 서론 = 1
Ⅱ. 데이터 마이닝 = 3
1. 지식발견을 위한 데이터 마이닝 = 3
2. 데이터속성 유형 = 6
3. 클러스터링 기법 = 10
Ⅲ. k-mode 개선 알고리즘 = 14
1. 알고리즘 정리 = 14
1) k-means algorithm = 14
2) k-mode algorithm = 17
3) k-prototype algorithm = 20
2. k-mode 개선 알고리즘 = 22
1) 초기치 k선정 방법 개선 = 22
2) 유사도 계산방식 개선 = 26
3) 속성간 웨이트(r) 적용 = 28
4) 개선된 k-mode 알고리즘 = 29
Ⅳ. 실험결과 및 분석 = 30
1. Database 실험 = 30
1) Soybean Database = 30
2) Mushroom Database = 40
2. 연구 비교 = 46
Ⅴ. 결론 및 제안 = 50
Ⅵ. 참고문헌 = 51
Degree
Master
Publisher
제주대학교 대학원
Citation
오수민. (2007). 기존 k-mode 알고리즘 개선을 통한 범주형 속성 데이터에 대한 효율적인 클러스터링 방법
Appears in Collections:
General Graduate School > Computer Science and Statistics
공개 및 라이선스
  • 공개 구분공개
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.