제주대학교 Repository

Cost-sensitive Learning in Estimation of Anchor Dragging Risk for a Vessel at Anchor

Metadata Downloads
Abstract
Heavy maritime traffic and the associated rise in vessel traffic density at anchorages have recently become prominent in maritime traffic safety. Anchoring operation is a complex task that necessitates experience, knowledge, and the capacity to anticipate all potential consequences of any decision. Despite the numerous publications available on anchoring practices, requirements, and procedures, there are still incidents of anchor dragging. Anchor dragging for ships at anchorage poses a serious risk to marine traffic as it may lead to collisions and the destruction of seabed infrastructure such as cables and pipelines. This study analyzed a substantial dataset of ships in anchorage areas. The goal was to develop a machine learning model for estimating the risk of anchor dragging among anchored ships using a binary classification system that distinguishes between non-dragging and dragging cases, thereby promoting maritime traffic and ship safety within harbors and anchorage zones.
Previous research studies conducted on dragging anchors were used to examine factors that cause the dragging of anchors at anchorage. The factors identified were; ship characteristics which consisted of ship length and draft, and hydro-meteorological factors which consisted of wind speed, direction of wind, depth of the sea, and nature of the seabed. The factors identified were used as input features for the anchorage dataset. The length and draft of the ship were extracted from historical automatic identification system, wind speed and direction were extracted from Korea Meteorological database, whereas the depth of the sea and nature of the seabed were extracted from hydrographic publications. The data were collated for each study case to form anchorage dataset.
A preliminary analysis of the anchorage dataset revealed a significant class imbalance ratio of 126:1 between the majority class, which consisted of non-dragging cases, and the minority class, which consisted of dragging cases, suggesting that the best machine learning strategy was majority-class undersampling in combination with cost-sensitive learning. Cost-sensitive learning is a type of machine learning where misclassification costs are taken into consideration to minimize costs. In this study, the cost was identified as the consequence of misclassification of a dragging candidate. Therefore, four cost-sensitive algorithms were proposed. Five undersampling techniques were proposed and optimized to resample the majority class to increase the prediction accuracy of the cost-sensitive algorithms.
A total of twenty models were developed from the combination of five data undersampling techniques and four cost-sensitive algorithms. The prediction performance of the twenty models was compared to the cost-sensitive algorithms to highlight the importance of undersampling techniques. The ideal model was envisioned to be that which minimizes misclassification of the dragging cases and has a robust ability to distinguish the classes. The recall score is the measure of algorithm ability to minimize minority class misclassification, whereas the area under the receiver operating characteristic curve (AUC) score is the ability to distinguish the classes. Therefore, the model with the highest recall and AUC scores was selected as the best machine learning model for estimating anchor-dragging risk on a binary scale of dragging or non-dragging and risk rank profiling of the anchor situation. The all k-nearest neighbors editing undersampler combined with cost-sensitive support vector machine and random undersampler combined with cost-sensitive support vector machine outperformed the other models, with recall, geometric mean, and AUC scores of 0.944, 0.63, 0.684, and 0.889, 0.792, 0.824, respectively.
Case studies were conducted to demonstrate the prediction accuracy of the models. The case study showed a consistent prediction of the anchor situation in comparison to the anchor situation of the trajectory plot. Finally, the potential applications and improvements for the prediction model were highlighted.| 해상 교통이 증가함에 따른 정박지에서 선박 교통 밀도 증가는 최근 해양 교통 안전에서 주목을 받고있습니다. 묘박은 경험, 지식, 그리고 어떤 결정의 모든 잠재적 결과를 예측할 수 있는 역량을 필요로하는 복잡한 작업입니다. 투묘 방법, 요구 사항 및 절차에 대한 수많은 간행물이 있음에도 불구하고, 주묘는 여전히 많이 발생하고 있습니다. 주묘 현상은 케이블과 파이프라인과 같은 해저 인프라의 충돌과 파괴로 이어질 수 있기 때문에 해상 교통에심각한 위험을 초래합니다. 본 연구에서는 묘박지에 있는 선박의 데이터를 분석했습니다. 본 연구의 목표는 항만 및 묘박지 내의 해상 교통 및 선박 안전을 증진시키기 위해 묘박중인 선박의 주묘 현상과 정상투묘를 구분하는 이중 분류 시스템을 이용하여 기계 학습(ML)모델을 개발하는 것입니다.
선행 연구를 통해 주묘를 유발하는 요인을 분석하였습니다. 식별된 요인은 선박의 길이와 흘수와 같은 선박 특성과 풍속, 풍향, 수심 그리고 해저 저질과 같은 해양 특성 요인이었습니다. 식별된 요인들은 묘박지 데이터의 특징으로 사용되었습니다. 선박 자동 식별 장치에서 배의 길이와 흘수를 추출하였으며, 풍속과 풍향은 한국 기상 데이터베이스에서, 수심과 해저 특성은 해양 간행물로부터 추출했습니다. 각 연구 사례에 대한 데이터는 앵커리지 데이터 세트를 형성하기 위해 수집되었습니다.
묘박 데이터셋의 예비 분석 결과 주묘로 구성된 대다수 클래스와 정상투묘로 구성된 소수 클래스 간의 불균형 비율은 133:1로 유의하게 나타났습니다. 이는 cost-sensitive learning과 결합 된 다수 계급의 언더샘플링이 최고의 ML 전략임을 나타냅니다. Cost-sensitive learning은 비용을 최소화하는 목표로 오분류 비용을 고려하는 기계 학습 유형입니다. 이 연구에서 비용은 주묘 후보의 잘못된 분류의 결과로 식별되었습니다. 따라서 네 가지 cost-sensitive learning 알고리즘이 제안되었습니다. Cost-sensitive learning 알고리즘의 예측 정확도를 높이기 위해 다수 클래스를 다시 샘플링하기 위해 5가지의 언더샘플링 기술이 제안했습니다. 5개의 데이터 언더샘플링 기술과 4개의 cost-sensitive learning 알고리즘을 결합하여 총 20개의 모델이 개발했습니다. 20개의 모델의 예측 성능을 cost-sensitive learning 알고리즘과 비교하여 언더샘플링 기법의 중요성을 강조했습니다. 이상적인 모델은 주묘 케이스의 잘못된 분류를 최소화하고 클래스를 식별할 수 있다. 리콜 점수는 소수 클래스 오분류를 최소화하는 알고리즘 능력의 척도이며, 수신기 작동 특성 곡선 (AUC) 점수 아래의 영역은 클래스를 구별하는 능력입니다. 따라서, 가장 높은 리콜 및 AUC 점수를 가진 모델을 주묘 또는 정상투묘의 척도로 주묘 위험을 예측하는 최상의 ML 모델로 선정하였습니다.cost-sensitive support vector machine과 random undersampler cost-sensitive support vector machine을 결합한 모든 k-nearest neighbors editing undersampler는 리콜, GM 및 AUC 점수가 각각 0.944, 0.63, 0.684 및 0.889, 0.792, 0.824로 다른 모델보다 높았습니다.
모델의 예측 정확성을 증명하기 위해 사례 연구를 수행하였습니다. 사례 연구는 항적의 투묘 상황과 비교하여 투묘상황의 일관된 예측을 보여주었습니다. 마지막으로, 예측 모델에 대한 잠재적 응용 프로그램과 개선이 강조되었습니다.
Author(s)
오난고 셈 오토이
Issued Date
2024
Awarded Date
2024-02
Type
Dissertation
URI
https://dcoll.jejunu.ac.kr/common/orgView/000000011812
Alternative Author(s)
Shem Otoi Onyango
Affiliation
제주대학교 대학원
Department
대학원 어업학과
Advisor
Kim Kwang-Il
Table Of Contents
Abstract ix
Abstract in Korean xi
1 Introduction 1
2 Literature Review 4
3 Anchorage dataset extraction 8
3.1 Behavioral characteristics of ship at anchorage 9
3.2 Features of an AIS data 12
3.3 Research study area 15
3.4 Anchorage dataset extraction 17
4 Cost-sensitive learning on imbalanced data 20
4.1 Class imbalance problem 20
4.2 Cost-sensitive learning 22
4.2.1 Cost-sensitive LR 23
4.2.2 Cost-sensitive SVM 24
4.2.3 Cost-sensitive XGB . 24
4.2.4 BBC 25
4.3 Data resampling . 26
4.3.1 RU undersampler 26
4.3.2 RENN undersampler 27
4.3.3 AKNN undersampler 27
4.3.4 OSS undersampler . 27
4.3.5 NCR undersampler . 28
4.4 Performance metrics . 29
5 Data analysis and experiment procedure 31
5.1 Class dispersion . 31
5.2 Exploratory data analysis 33
5.2.1 Dragging samples analysis 38
5.3 CSA and resampling techniques . 41
6 Experiment results and discussion 49
6.1 Case study validation . 53
6.2 Risk criterion 57
6.3 Anchor safety assessment at anchorage areas 62
7 Conclusion and recommendations 66
7.1 Conclusion 66
7.2 Recommendation 67
APPENDICES 68
REFERENCES 74
Acknowledgement 81
Degree
Doctor
Publisher
제주대학교 대학원
Citation
오난고 셈 오토이. (2024). Cost-sensitive Learning in Estimation of Anchor Dragging Risk for a Vessel at Anchor.
Appears in Collections:
General Graduate School > Fishery
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2024-02-12
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.