분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제출 문의
답변 출처: https://dacon.io/competitions/official/235720/support/402911?page=2&dtype=recent
조금 헷갈리는 부분이 있어서 문의를 드립니다.
추가 질문 드립니다.
답변 #1에 대하여,
결론적으로 전날 데이터를 쓰기만 하면 뭐든지 상관 없다는 걸로 이해하면 될까요? (예를 들어, 2/2 예측은 2/1까지, 2/3 예측은 2/2까지)
답변 #2에 대하여,
1) Private 평가 기간에는 train 데이터가 매일마다 업데이트 되나요?
2) Private 평가 기간은 그럼 채점하는 전날의 발전량만 채점한다고 보면 되나요?
- 예를 들어>> 6/10에 제출한 결과파일은 6/11 예측치만 있으며 6/11 예측치만 평가, 6/11일에 제출한 결과파일은 6/12 예측치만 있으며 6/12 예측치만 평가.
답변 #1에 대하여,
- 대회 규칙에 위반되는 데이터가 아니면 전날 얻을 수 있는 모든 데이터가 사용 가능합니다.
답변 #2에 대하여,
- private 평가기간 추가 train데이터는 제공되지 않습니다.
- private 평가 기간은 매일 선택된 파일중 해당 일에 대한 데이터를 가져와 누적 평가가 진행됩니다.
-- 6월 9일 평가 -> 6월 8일에 선택한 파일중 6월 9일 데이터 1일치 평가
-- 6월 10일 평가 > 6월 8일에 선택한 파일중 6월 9일 데이터, 6월 9일에 선택한 파일중 6월 10일 데이터 2일치 평가
...
이런식으로 누적해 평가가 진행됩니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요.작성자님
1. Public에서 당일 기상 데이터를 사용하는 것은 data leakage로 불가능합니다. public은 과거 데이터를 가지고 실제(private) 적용할 모델의 성능 확인에 목적이 있습니다. 만약 당일 기상 데이터를 사용할 경우 실제 사용이 불가한 방법이고 이는 data leakage에 해당합니다.
2. private 평가시에는 말씀하신 방법대로 하루치가 아닌 여러일을 한번에 예측하여 제출 가능합니다.
감사합니다.
데이콘 드림