이커머스 고객 세분화 분석 아이디어 경진대회

아이디어 | 정형 | 시계열 | 이커머스 | 정성평가

  • moneyIcon 상금 : 인증서
  • 891명 마감

 

RFM score 기반 / 관심 카테고리 기반 / 고객 구매활동 기반 고객 세분화 제안

2024.02.26 00:58 307 조회 language

고객 세분화를 위해 다양한 분석방식을 적용해보았습니다. 크게는 아래와 같은 5개의 분석 및 간단한 구간 분류, 특정 변수를 활용한 그룹핑을 통해 각 그룹별 유의미한 차이가 있는지 확인해보았고, 이러한 분석 결과 및 여기에서 파생된 변수들을 활용하여 3가지 클러스터링 방식을 제안하게 되었습니다.

• 고객 세분화 분석 - 고객을 지역, 성별 및 선호 카테고리에 따라 분류 및 분석.
• 시계열 분석 - 월/요일/일별 판매량 추이, 매출 추이, 카테고리별 판매 비중, 할인 적용율 및 쿠폰 사용률 분석 실시.
• 구매 패턴 분석 - 쿠폰 사용률, 구매 제품 다양성, 고매주기 등을 기준으로 사용 패턴을 분류하고 특성 파악.
• 이탈 분석 - 이탈 간격 및 결제 간격을 기반으로 개별 고객의 이탈 위험률 계산 및 특성 파악 .
• RFM 분석 - 결제 간격, 구매 빈도 및 총 소비 금액을 기준으로 고객 분류 및 특성파악.

최적의 cluster 탐색 방식은 클러스터 포함 데이터 비중과 silhouette 계수를 주로 활용하였고, 군집화 방식과 최적 군집 탐색을 반복문을 활용하여 최대한 다양하게 적용해보며 결과를 기록하고 최적의 방식을 탐색하였습니다.



분석에 활용한 데이터프레임은 아래와 같습니다.

1. df_all : onlinesales_info 데이터를 기준으로 상품ID, 고객ID를 key로 하여 제공된 모든 데이터프레임 merge
2. customer_df : 고객ID 기준으로 각 고객의 개인정보/관심 카테고리/구매기록을 요약한 데이터프레임
3. user_category_n_df : 각 고객 ID별 제품 카테고리별 구매수량

PDF
코드