가스공급량 수요예측 모델개발

알고리즘 | 정형 | 회귀 | 수요예측 | NMAE

  • moneyIcon 상금 : 총 3,250만원
  • 475명 마감
마감

 

외부데이터 사용 질문입니다.

작성자 비공개
2021.11.02 22:38 1,087 조회

안녕하세요 다른 대회 문의를 보고 공지사항을 보고도 이해하기 어려운 부분이 있어서 문의 남깁니다.

데이터 누출과 관련하여 2019년 이후 "공개"된 데이터가 사용하기 어렵다는 것으로 이해했습니다.

하지만 2019년 이후에 공개된 데이터 중 TRAIN 데이터의 기간이 2013~2018년인 부분만 사용하는 건 괜찮은지에 대해 궁금합니다.

예시로 2011~2021년의 날짜 데이터 중 2013~2018년까지의 데이터만 추출하여 사용이 가능한지 궁금합니다.

로그인이 필요합니다
0 / 1000
DACONIO
2021.12.21 11:54

안녕하세요 작성자님.

말씀하신 경우가 구체적으로 어떤 사례인지 말씀주실 수 있는지요? 
예측시점(본 대회의 경우 2018년 12월 31일 이전)의 데이터라면 공개시점이 그 후라 하더라도 가능하다고 판단하고 있습니다(과거의 데이터인데 공개 시점이 늦어질 수 있고, 추후 원천 과거 데이터에 문제가 있다고 판단될 경우 추후 수정보완을 거쳐 공개도 될 수 있다고 생각합니다.) 다만, 특수한 사례의 가능성을 배제할 수 없어 구체적인 사례를 말씀해 주시면 확답 드릴 수 있습니다. 

감사합니다.
데이콘 드림.

anonymous
작성자
2021.11.03 22:52

제가 예시로 "날씨"라고 했어야하는데 "날짜"라고 작성했네요. 죄송합니다. 날씨 데이터의 경우 과거의 데이터인데 대회의 시점보다 공개시점이 늦은 데이터를 의미한 것입니다.  

DACONIO
2021.12.21 11:54

안녕하세요 작성자님.

네 말씀하신 데이터는 2018년 12월 31일 이전의 자료로 판단되며 사용하실 수 있습니다.

감사합니다.
데이콘 드림.