2024 NH 투자증권 빅데이터 경진대회

빅데이터 | NH | 분석 | AI | ETF | Microsoft | Tableau | 시각화 | 아이디어

  • moneyIcon 상금 : 6,300만원
  • 885명 마감

 

ETF 지표 기반 군집화 및 생성형 AI 기반 ETF 요약·단어 중요도 큐레이션 서비스

공동작성자

stroke
2024.10.09 19:06 962 조회 language

안녕하세요! 팀 엔에취입니다.

<분석 목적>
 현재 시장에는 수많은 ETF가 존재하며, 각 ETF의 성과와 리스크를 비교하여 최적의 선택을 하는 것이 중요합니다. 또한 다양한 자산을 포함한다는 ETF의 특징 때문에, 구성 종목들의 분석이 복잡합니다. 이를 해결하기 위해 ETF의 지표를 이용해 군집화하여, 투자자 성향에 맞는 ETF를 큐레이션 하고자 합니다. 또한 생성형 AI를 통해 ETF 구성 종목들을 요약하여 설명을 제공하고 그 설명 속 키워드에 대해 중요도를 제공하여 투자자의 성과에 도움을 주고자 합니다.

<분석 절차>
1. ETF 지표 기반 군집화 후 군집 해석 및 군집별 대표 ETF 큐레이션
- ETF점수정보 테이블의 ETF 지표들을 이용해서 군집화 진행
- 군집화 결과 해석에 기반하여, 각 군집의 이름을 명명
   [군집화 결과 해석]
   군집 0 : 투자를 권장하지 않는 ETF 군집(중간 정도의 성과와 높은 변동성을 지닌 군집)
   군집 1 : 일반적으로 투자를 권장하는 ETF 군집(높은 성과와 높지 않은 변동성을 지닌 군집)
   군집 2 : 안정성이 우선인 투자자를 위한 ETF 군집(낮은 성과와 낮은 변동성을 가진 군집)
- 각 군집 별 대표 ETF들을 도출 후 큐레이션

2. 생성형 AI를 이용해 ETF를 구성 종목들의 설명을 요약
- Microsoft Azure를 이용해 생성형 AI 사용
- 생성형 AI를 이용해 큐레이션 하고자 하는 ETF의 구성 종목들의 설명들을 요약

3. ETF의 요약글 속 단어들의 중요도 큐레이션
- ETF 구성 종목들의 설명 속 키워드와 수익률 간의 관계 파악
- XAI를 통한 설명 속 키워드의 중요도 산정 모델 구축
- ETF의 요약글 속 단어들의 중요도 큐레이션

<최종 산출물>
1. ETF 지표 기반 군집화 및 ETF 큐레이션
2-1. 추천된 ETF에 대한 생성형 AI 요약글 및 키워드 중요도 큐레이션
2-2. 추천된 ETF의 구성종목들 각각에 대해, 수익률에 긍, 부정 영향을 미친 키워드 중요도 제공

코드