제주대학교 Repository

RFM 모형의 가중치 선택에 관한 연구

Metadata Downloads
Alternative Title
Data driven selection methods of weights in RFM Model
Abstract
본격적인 4차 산업혁명 시대를 맞이하면서 전반적인 분야에서 데이터를 활용한 다양한 전략들이 제시되고 있다. 이는 기업의 전략적인 의사결정을 통해 물질적, 시간적 비용을 절감할 수 있고 기업 이윤을 극대화할 수 있는 새로운 마케팅 방법론을 고안할 수 있게 되었다.
급변하는 생활 패턴 속에서 고객은 다양한 욕구를 표현하고 있으며 기업은 이러한 고객의 기대에 부응하기 위해 고객의 구매 데이터를 정제하고 분석하여 고객 구매 패턴을 예측하고 기존 고객을 유지하면서 신규 고객을 모집 할 수 있는 방안을 제시하고 있다. 이러한 방법 중 대표적으로 널리 사용되고 있는 고객관계관리(CRM, Customer Relationship Management)는 오늘날 대량의 데이터가 축적되면서 데이터마이닝 기법과 연계하여 다양한 방법으로 분석할 수 있다. RFM(Recency, Frequency, Monetary)모형은 전통적인 고객관계관리 기법 중 하나로 간단하고 편리한 모델링 방법이며 그 예측력이 뛰어나 현재까지 많이 사용되고 있다. 그러나 RFM 모형 설계에서 가장 중요한 것은 각 변수에 가중치를 부여하는 것인데 현재까지 명확한 가중치의 기준은 제시된 것이 없는 상태다.
본 논문에서는 RFM모형을 보다 효율적으로 설계할 수 있는 가중치 선택 방안을 제시하고자 한다. 빅데이터 분석기술 중 하나인 군집분석에서 대표되는 K-Means 알고리즘을 활용하여 데이터를 군집화하고 각 군집의 Recency, Frequency, Monetary 세 가지 요소의 CV(Coefficient of Variation, 변동계수)값을 활용하여 RFM 모형의 가중치로 선택한다. 최종적으로 설계된 RFM 모형에서 RFM 점수를 산출하여 각 고객들에게 부여하고 전체 고객을 5개의 등급화된 집단으로 세분화하는데 목적이 있다.
본 연구에는 총 3개의 데이터셋이 활용되었으며 각 데이터셋은 6,116건, 549,019건, 6,919건의 고객 구매데이터로 이루어져 있고 인구통계학적 변수를 포함한 고객 정보와 더불어 RFM 분석에 필요한 세 가지 요소인 구매시기(Recency), 구매빈도(Frequency), 구매금액(Monetary)를 포함한다.
Python의 기계학습 라이브러리를 활용하여 Elbow method를 통해 얻어낸 최적의 K값을 각 데이터셋에 적용하고 K개로 나눠진 각 집단의 R, F, M 변수의 통계량을 통해 가중치를 선택하여 최종 RFM 모형을 설계하고 전체 고객들에게 점수를 부여하여 최종 5개의 집단으로 분류하였다.
이를 통해 목표변수가 없는 구매데이터 특성의 한계를 극복할 수 있었으며 K-Means Clustering을 통해 군집화된 집단별 변수의 특성이 반영된 객관적인 방법으로 가중치를 선택한 RFM 모형을 설계할 수 있었고 이를 통해 보다 나은 고객 세분화가 가능하였다.
As we enter the era of the 4th industrial revolution in earnest, various strategiesusing data are being proposed in the overall field. This made it possible to devise anew marketing methodology that can reduce material and time costs and maximizecorporate profits through strategic decision-making.In a rapidly changing lifestyle, customers express various desires, and in order tomeet these customer expectations, companies can refine and analyze customerpurchasing data to predict customer purchasing patterns and retain existing customerswhile recruiting new customers suggesting a way out. Among these methods,customer relationship management (CRM), which is widely used representatively, canbe analyzed in various ways in connection with data mining techniques as a largeamount of data is accumulated today. The RFM (Recency, Frequency, Monetary)model is a simple and convenient modeling method as one of the traditionalcustomer relationship management techniques. However, the most important thing inRFM model design is to assign weights to each variable, and there is no clearstandard for weighting so far.In this paper, we propose a weight selection method that can design the RFM modelmore efficiently. One of the big data analysis techniques, the K-Means algorithmrepresented by clustering, is clustered and selected as the weight of the RFM modelby utilizing the Coefficient of Variation (CV) values of the three components of eachcluster: Recency, Frequency, and Monetary. The purpose is to calculate the RFM score from the finally designed RFM model, assign it to each customer, andsubdivide the entire customer into five graded groups.A total of three datasets were used in this study, and each dataset consists of 6,116,549,019, and 6,919 customer purchase date(Recency), purchase frequency(Frequency),and purchase amount (Monetary) are included.Using Python's machine learning library, the optimal K value obtained through theElbow method is applied to each dataset, and the final RFM model is designed byselecting weights through the statistics of R, F, and M variables of each groupdivided into K groups. Scores were given to all customers and classified into fivegroups.This allowed us to overcome the limitations of purchase data characteristics withouttarget variables, and K-Means Clustering allowed us to design RFM models withweights selected in an objective way that reflected the characteristics of clusteredgroup variables, which enabled better customer segmentation.
Author(s)
김동석
Issued Date
2021
Awarded Date
2021. 8
Type
Dissertation
URI
https://dcoll.jejunu.ac.kr/common/orgView/000000010237
Alternative Author(s)
Kim, Dong Seok
Affiliation
제주대학교 대학원
Department
대학원 전산통계학과
Advisor
김철수
Table Of Contents
제 1 장 서론 1
제 1 절 연구 배경 1
제 2 절 연구 목적 3
제 3 절 연구 방법 및 범위 4
제 4 절 연구 구성 5
제 2 장 이론적 배경 7
제 1 절 고객 세분화 7
제 2 절 K-Means Clustering 8
제 3 절 RFM 분석 11
1. RFM 분석의 개념 11
2. RFM 모형 설계 12
3. RFM 모형의 가중치 선택에 관한 선행연구 14
1) 파레토 법칙에 의한 결정 15
2) 로지스틱 회귀분석에 의한 결정 17
3) 직관에 의한 결정 17
제 3 장 연구 방법 21
제 1 절 조사 설계 21
1. 분석 대상 21
2. 데이터 전처리 24
3. 분석 방법 25
제 2 절 RFM 모형 설계 25
1. R값 설정 25
2. F값 설정 27
3. M값 설정 28
제 3 절 데이터 군집화 30
제 4 절 RFM 모형의 가중치 산출 35
제 4 장 연구 결과 38
제 1 절 고객 세분화 38
1. RFM 점수 부여 38
2. 5개 등급 구분 41
3. 5개 등급 비교 44
제 2 절 RFM 모형 비교 46
1. 비교 모형 설계 46
2. 모형 비교 48
제 5 장 결론 52
제 1 절 연구의 요약 52
제 2 절 연구의 한계점 53
제 3 절 향후 연구 방안 54
참고문헌 55
국문 초록 61
Degree
Master
Publisher
제주대학교 대학원
Citation
김동석. (2021). RFM 모형의 가중치 선택에 관한 연구
Appears in Collections:
General Graduate School > Computer Science and Statistics
공개 및 라이선스
  • 공개 구분공개
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.