제주대학교 Repository

RDBMS에서의 효율적인 XML 부분 매치 질의 처리

Metadata Downloads
Alternative Title
The Efficient XML Partial Match Query Processing on RDBMS
Abstract
부분 매치 질의는 경로 질의 상에 조상-자손 관계성 '//'를 가지는 질의로 정의되며, 선형 경로 질의와 분기 경로 질의로 구분된다.
본 논문에서는 상이한 구조를 가지는 대규모 문서들에 대해서 부분 매치 질의를 효과적으로 처리하기 위하여 2가지 방법을 제안한다. 제안 방식은 기존의 순수 RDBMS를 기반을 두고 새로운 인덱스 기술과 조인 알고리즘을 사용하여 질의 처리 효율성과 확장성을 개선한다.
하나는 인덱스 구축을 위해 사용된 기법으로 경로 레이블 정보를 저장함에 있어서, 기존의 연구에서 사용된 순방향 레이블 경로 대신 역방향 레이블 경로를 사용하여 경로 인덱스를 구축한다. 구축된 인덱스는 대량의 상이한 구조의 문서가 존재하는 상황에서도 전체 매치 질의는 물론 부분 매치 질의 처리시 해당되는 레이블 경로들에 대하여 빠른 접근을 허용하여 질의 처리 성능을 개선시킨다.
또 하나는 선형 경로 질의 결과 간의 결합을 위해 사용되는 조인 알고리즘을 제안한다. 제안된 조인 알고리즘은 먼저 두 레이블 경로 간에 유효하지 않은 경로 연결을 식별하고 나서, 유효한 레이블 경로에 소속된 레이블 경로 인스턴스들만을 이용함으로써 조인 연산에 참여하는 튜플들의 비교 횟수를 줄인다. 제안 알고리즘은 단독 또는 조인 연산의 성능을 개선시키기 위하여 기존 조인 알고리즘과 함께 사용될 수 있다.
마지막으로, 제안방식의 효율성 검증을 위해 기존 연구들과의 비교 분석을 수행하였다.
A partial match query is defined as the one having the descendant-or-self axis '//' in its path query. It can be classified as a linear path query or a branching path query.
In this thesis, we suggest two methods for processing partial match queries efficiently on a large amount of the differently-structured documents.
One is the new index structure constructed using backward label paths instead of forward label paths used in previous researches for storing the path information. It allows for finding the label paths efficiently than the conventional methods and improves the performance of query processing.
The other is the join algorithm used for merging results of linear path queries. The proposed algorithm reduces the number of the comparison of tuples that participate in join operation firstly by identifying invalid connections among the two label paths and then, using only abel path instances belong to valid path-connections. It can be used alone or to improve the performance of the join operation with the conventional join algorithm.
Finally, We demonstrated the efficiency of the proposed method by comparing it with the conventional methods.
Author(s)
박충희
Issued Date
2008
Awarded Date
2008. 2
Type
Dissertation
URI
http://dcoll.jejunu.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000004332
Alternative Author(s)
Park Chung-Hee
Affiliation
제주대학교 대학원
Department
대학원 컴퓨터공학과
Advisor
李尙俊
Table Of Contents
I. 서론 = 1
1. 연구 배경 및 목적 = 1
2. 연구 내용 및 논문 구성 = 4
II. 관련 연구 = 7
1. XML 인덱싱 = 7
1) 네이티브 XML 시스템 = 8
2) 관계 데이타베이스 = 9
2. 노드 레이블 부여 기법 = 16
1) 구간-기반 레이블링 기법 = 17
2) 프리픽스 레이블링 기법 = 18
3) 소수 레이블링 기법 = 18
3. 데이타베이스 스키마 = 19
1) XRel = 19
2) XParent = 20
3) EPIS = 21
4) XIR-Branching = 22
4. XML 질의 처리 = 23
1) 네이티브 XML 시스템의 조인 = 23
2) 관계 데이타베이스에서의 조인 = 25
III. 제안 XML 인덱싱 = 37
1. XML 문서 모델 = 37
2. XML 질의 모델 = 39
3. XML 질의 패턴 = 42
4. XML 인덱싱 = 45
1) XML 질의 특성 분석 = 45
2) XML 인덱스 구조 = 47
5. 제안 시스템 구조 = 50
1) 시스템 구조 = 50
2) 데이타베이스 스키마 = 51
IV. 제안 XML 조인 = 56
1. XML 조인 알고리즘 = 56
1) 기존 조인 알고리즘의 분석 = 56
2) 제안 조인 알고리즘의 기본 아이디어 = 58
3) 제안 조인 알고리즘 = 63
2. 질의 처리 알고리즘 적용 예 = 75
V. 성능 평가 = 81
1. 실험 환경 = 81
1) 인덱스 실험 환경 = 81
2) 조인 알고리즘 실험 환경 = 82
2. 실험 결과 및 분석 = 84
1) 인덱스 실험 = 84
2) 조인 알고리즘 실험 = 86
VI. 결론 = 92
참고문헌 = 95
Degree
Doctor
Publisher
제주대학교 대학원
Citation
박충희. (2008). RDBMS에서의 효율적인 XML 부분 매치 질의 처리
Appears in Collections:
General Graduate School > Computer Engineering
공개 및 라이선스
  • 공개 구분공개
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.