‘Korea East-West Power Corporation’ Solar Power Prediction AI Competition

Algorithm | Structured | Regression | Energy | NMAE

  • moneyIcon 16,000,000 KRW
  • 1,595 Users Completed

 

제출 문의

Anonymous
2021.04.30 13:57 2,214 Views

답변 출처: https://dacon.io/competitions/official/235720/support/402911?page=2&dtype=recent


조금 헷갈리는 부분이 있어서 문의를 드립니다.


  1. Public 평가의 제출물은 위의 그림에서 #1, #2 두 가지 방법으로 구성할 수 있으나 당일 기상데이터를 가지고 당일의 발전량을 예측하는 것이 금지되는 것인가요?
  2. Private 평가는 매일매일 제출해야 정확한 결과를 확인할 수 있다고 하셨는데, 정리하면... #2 방법도 가능하다. #1 방법으로 할 때에는 제출일자 전까지의 기상데이터 활용하여 제출일자에 해당하는 발전량을 계산 및 제출. 이렇게 이해하면 될까요?



Login Required
0 / 1000
DACONIO
2021.12.22 10:38

안녕하세요.작성자님

1. Public에서 당일 기상 데이터를 사용하는 것은 data leakage로 불가능합니다. public은 과거 데이터를 가지고 실제(private) 적용할 모델의 성능 확인에 목적이 있습니다. 만약 당일 기상 데이터를 사용할 경우 실제 사용이 불가한 방법이고 이는 data leakage에 해당합니다.

2. private 평가시에는 말씀하신 방법대로 하루치가 아닌 여러일을 한번에 예측하여 제출 가능합니다.

감사합니다.
데이콘 드림

anonymous
Writer
2021.05.03 11:43

추가 질문 드립니다.

답변 #1에 대하여, 
결론적으로 전날 데이터를 쓰기만 하면 뭐든지 상관 없다는 걸로 이해하면 될까요? (예를 들어, 2/2 예측은 2/1까지, 2/3 예측은 2/2까지)

답변 #2에 대하여, 
1) Private 평가 기간에는 train 데이터가 매일마다 업데이트 되나요?
2) Private 평가 기간은 그럼 채점하는 전날의 발전량만 채점한다고 보면 되나요?
  - 예를 들어>> 6/10에 제출한 결과파일은 6/11 예측치만 있으며 6/11 예측치만 평가, 6/11일에 제출한 결과파일은 6/12 예측치만 있으며 6/12 예측치만 평가.

DACON.Dobby
2021.05.07 15:11

답변 #1에 대하여,
 - 대회 규칙에 위반되는 데이터가 아니면 전날 얻을 수 있는 모든 데이터가 사용 가능합니다.

답변 #2에 대하여,
 - private 평가기간 추가 train데이터는 제공되지 않습니다.
 - private 평가 기간은 매일 선택된 파일중 해당 일에 대한 데이터를 가져와 누적 평가가 진행됩니다.
 -- 6월 9일 평가 -> 6월 8일에 선택한 파일중 6월 9일 데이터 1일치 평가
 -- 6월 10일 평가 > 6월 8일에 선택한 파일중 6월 9일 데이터, 6월 9일에 선택한 파일중 6월 10일 데이터 2일치 평가
...
이런식으로 누적해 평가가 진행됩니다.