2024 NH 투자증권 빅데이터 경진대회

빅데이터 | NH | 분석 | AI | ETF | Microsoft | Tableau | 시각화 | 아이디어

  • moneyIcon 상금 : 6,300만원
  • 880명 마감

 

🌏 ETF 탐험대: 잠재력 있는 ETF를 찾아서!

2024.10.11 07:42 1,123 조회 language

1. 데이터 수집 및 전처리: 이번 분석에서는 NH투자증권이 제공한 ETF 데이터와 yfinance 라이브러리를 통해 수집한 S&P 500 지수 데이터를 활용했습니다. 결측치는 중앙값으로 보정했고, 분석에 꼭 필요한 변수들만 골라 사용했습니다.
2. 특성 엔지니어링: ETF의 변동성, 수익률, 그리고 S&P 500 지수와의 비교를 통해 ETF의 주요 특성을 파악했습니다. 이동 표준편차로 변동성을 계산했고, S&P 500 지수와의 성과 비교를 통해 ETF의 상대적 효율성을 평가했습니다. 또한, 리스크 조정 수익률도 계산해 ETF의 안정성과 수익성을 함께 살펴보았습니다.
3. 모델 구축 및 평가: 랜덤 포레스트 회귀 모델을 사용해 ETF의 다음 기간 수익률을 예측했습니다. 데이터를 훈련 세트와 테스트 세트로 나눠 모델을 학습시켰고, 교차 검증을 통해 성능을 평가했습니다. 모델의 설명력은 다소 낮았지만, 개선의 여지가 있는 방향성을 확인할 수 있었습니다.
4. 외부 정보 통합 및 생성형 AI 적용: 외부 금융 뉴스 데이터를 활용해 ETF의 최신 정보를 수집했습니다. 생성형 AI를 사용해 ETF에 대한 요약 설명을 생성하여 투자자들이 이해하기 쉽게 제공했습니다. 이를 통해 투자자들이 보다 현명한 매수/매도 결정을 내릴 수 있도록 했습니다.

코드