제주 신용카드 빅데이터 경진대회

시장상황의 왜곡

2020.06.29 16:14 5,077 Views

트레이닝하는  데이터는 작년 1월부터의 데이터지만 최종 test데이터는 대회가 끝나는 시점인 올해 7월을 예측해야하는데 코로나 전후로 갈리기에 전혀 다른 마켓상황으로 봐야해서 빅데이터 분석의 기본 가정인 '과거와 다른 조건이 동일하다 가정할때 과거 데이터로 미래를 예측할 수 있다'가 깨져서 의미있는 학습이 원칙상 불가능할 것이라 생각되는데 채점기간을 차라리 더 과거 데이터(2015 등)를 가지고 테스트를 한다던가 하는식으로 바꿔야하지 않을까요?.. 2020년7월을 딱 코로나 본격화 직전까지인 19년 1-20년 03월 데이터로 파악하는건 시계열분석을 고려하더라도 코로나때문에 의미가 너무 적을 것 같은데요ㅠㅠ

로그인이 필요합니다
0 / 1000
DACONIO
2020.07.06 10:32

SMJ님 안녕하세요. 
제주 신용카드 빅데이터 경진대회는 지역 경제 위축 및 중소상공인 경영난 대책 마련을 위해  ‘Post COVID-19 시대’ 신용카드 사용량 예측 모델 개발을 목표로 하고 있습니다. 대회 취지에 따라 COVID-19 전후 데이터를 사용합니다.
일반적인 상황의 시계열 분석을 원하신다면 상점 신용카드 매출 예측 경진대회를 추천 드립니다. 이번 대회와 비슷하게 카드데이터를 사용하지만 코로나 전 데이터로만 구성되어 있습니다. 종료된 대회라도 연습제출이 가능하니 많은 이용바랍니다.
감사합니다.