2024 NH 투자증권 빅데이터 경진대회

빅데이터 | NH | 분석 | AI | ETF | Microsoft | Tableau | 시각화 | 아이디어

  • moneyIcon 상금 : 6,300만원
  • 885명 마감

 

고객 포트폴리오 기반 웹툰 생성 및 추천 ETF 큐레이션 서비스

공동작성자

stroke
2024.10.11 03:58 980 조회 language

### 1. 개요

고객이 매수 및 매도한 데이터를 바탕으로 해당 종목의 수익률을 파악하고,  투자한 기간 동안 높은 수익률을 기록한 미국 ETF를 선별합니다. 해당 ETF를 기반으로 웹툰을 생성하여 흥미를 유도합니다. 웹툰은 고객의 투자 가볍고 재미있게 표현하며,  투자자의 긍정적인 반응을 이끌어냅니다.

그 후, 해당 ETF를 포함해 여러 기준(수익성, 안정성, 성장 가능성, 고수의 선택 등)에 따라 ETF들을 선정하고, 고객 맞춤형 큐레이션 서비스를 제공합니다.

### 2. 데이터 분석

#### 2.1 투자자 행동 분석

투자자를 고수와 자산가로 구분하여 행동을 분석하였습니다.  이를 통해 각 그룹에 맞는 맞춤형 ETF나 주식을 추천할 수 있는 기초 자료를 마련하였습니다.

#### 2.2 ETF 안정성 평가

각 ETF의 안정성을 평가하기 위해 순자산, 정보비율, 샤프지수, 상관관계, 트래킹 에러, 최대 낙폭, 변동성 등 다양한 지표를 활용해 안정성 점수를 산출하였습니다. 안정성 점수는 각 지표에 가중치를 부여하여 계산되었습니다:


1. **데이터 수집 및 전처리**: 야후 API를 이용해 데이터를 수집하고, 결측값은 평균값으로 대체하였습니다.
2. **정규화 과정**: MinMaxScaler를 사용해 데이터를 정규화하여 점수화하였습니다.
3. **가중치 부여 및 점수 계산**: 위의 가중치를 사용해 각 지표별로 안정성 점수를 계산하였습니다.

#### 2.3 주가 예측 모델

기술적 지표, 기본 가치, DCF 평가, 감성 점수를 종합하여 주가를 예측합니다. 모델은 다음 요소들을 결합해 예측 결과를 도출합니다:

- **기술적 지표 계산**: 이동평균선, 상대강도지수, 변동성 등을 계산하여 주가의 패턴과 미래 변동성을 예측합니다.
- **기본 가치 평가**: DCF 모델을 사용해 가치를 평가하고, 저평가 또는 고평가 여부를 판단하였습니다.
- **감성 분석**: 뉴스 기사를 활용해 TextBlob으로 감성을 분석하고, 이를 반영하였습니다.

코드