태양광 발전량 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 에너지ㅣPinball Loss

  • moneyIcon Prize : 600만원
  • 2,313명 마감

 

[참고] 정답 양식과 Pinball loss에 대한 참고자료

2020.12.09 13:04 8,021 Views


안녕하세요 데이콘입니다.


정답 양식


30분 간격의 예측값에 대한 10%,20%,...90% quantile



Pinball loss


  • High penalty to underforecast above 50% percentiles
  • High penalty to overforecast below 50% percentiles
  • 높은 quantile 값에서는 측정된 값이 예측값보다 낮아야 함 >> overforecast 유도
  • 반대로 낮은 quantile값에서는 측정된 값이 예측값보다 높아야 함 >> underforecast 유도




     τ: 퀀타일 값 (0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9)

     y: 실제 값

     z: 퀀타일 예측값

     Lτ: pinball loss 함수


참고 자료 링크: https://medium.com/analytics-vidhya/a-tutorial-on-quantile-regression-quantile-random-forests-and-quantile-gbm-d3c651af7516



감사합니다.

데이콘 드림.

로그인이 필요합니다
0 / 1000
Jamm
2020.12.10 02:14

이게 그러면 퀀타일값 9개에 대해서 9번 예측을 해야하는건가요?

DACONIO
2020.12.10 10:43

안녕하세요. 데이콘입니다.
먼저 이번 대회에 관심을 가져주시고 적극적으로 참여해주셔서 감사드립니다.
말씀하신대로 퀀타일값 9개에 대해서 9번 예측을 하는 것이 맞습니다.
이 외에 또 다른 궁금한 점 있으시면 언제든지 질문해주세요.
감사합니다.

MS.KIM
2020.12.10 15:14

만약 예측값이 10이라오면
Sub파일에 1,2,3,4,5,6,7,8,9 
이렇게 입력하나요?

DACONIO
2020.12.11 12:07

안녕하세요. 데이콘입니다.
먼저 이번 대회에 관심을 가져주시고 적극적으로 참여해주셔서 감사드립니다.
하나의 시간대에 총 9개의 예측 값이 나와야 하는 것입니다.
예를 들어서 0.csv 파일의 다음날 0시 0분의 값을 예측한다면,
0.csv_Day7_0h00m 행의 q_0.1 ~ q_0.9 총 9개의 열에 각 quantile 값에 해당하는 예측 값을 넣어주셔야 합니다.

DACONIO
2020.12.11 12:07

quantile 값을 어떤 값을 넣느냐에 따라서 결과가 다르게 나오기 때문에 이 점 유의하셔서 예측 결과를 내주시면 되겠습니다.
이 외에 또 다른 궁금한 점 있으시면 언제든지 질문해주세요.
감사합니다.

이상진
2020.12.10 16:06

그러니까 각각의 시간대별 발전량 예측이 총 9개의 Quantile 값에따라 9개가 나와야 하고, 
하루에 48*9  = 432 개의 예측을 해야하는게 맞는건가요?

DACONIO
2020.12.11 12:10

안녕하세요. 데이콘입니다.
먼저 이번 대회에 관심을 가져주시고 적극적으로 참여해주셔서 감사드립니다.
1일치가 총 48개, 하루 뒤와 이틀 뒤를 예측해야 하므로 곱하기 2, test 데이터 셋이 총 81개의 파일이니 곱하기 81을 하면 행이 총 7776개,
인덱스 1개, 퀀타일 값 0.1부터 0.9까지 9개 하면 열이 총 10개,
그래서 sample_submission 파일의 크기가 7776x10이 되는 것입니다.
이 외에 또 다른 궁금한 점 있으시면 언제든지 질문해주세요.
감사합니다.

Dongjunee
2020.12.12 13:24

각 quantile별로 pinball loss가 산출된다고 이해했는데, 각 quantile별 pinball loss의 평균으로 평가를 하는건가요?

DACON.JeanValjean
2020.12.14 10:09

안녕하세요,

리더보드 상의 점수는 각 시간대의 퀀타일별 pinball loss 값의 총 평균값으로 산정이 됩니다.
따라서 quantile별 pinball loss의 평균의 평균으로 평가를 하는 것이라고 설명 드릴 수 있을 것 같습니다.

감사합니다. 

데이콘팀 드림

최정명
2020.12.14 02:27

구글링을 자주 하다보면 medium에 올려져 있는 자료를 자주 보게 되는데 이렇게 되면 medium 페이지의 한 달 제한량에 걸려 접속 제한이 될 때가 있습니다.
이럴 경우 시크릿모드(Ctrl + Shift + N)를 통해 들어가면 제한없이 볼 수 있어요.

참고 자료 링크에 접속할 때 문제가 있으면 사용해보세요!

당쇠
2020.12.13 21:52

좋은 팀 감사합니다. 최정명님

2020.12.14 03:24

결국 각 quantile 값에 따라서 달라지는 것은 input(training) data가 아니라 loss 값이고,

서로 다른 9개의 모델의 output을 입력해주는것이 맞나요?

DACONIO
2020.12.16 10:15

안녕하세요. 데이콘입니다.
먼저 이번 대회에 관심을 가져주시고 적극적으로 참여해주셔서 감사드립니다.
네 맞습니다. 같은 Input data를 넣어주어도 각 Quantile 값에 따라서 다른 결과가 나오게 됩니다. 따라서 각 Quantile 값에 대한 각각의 모델, Quantile 값이 9개이므로 서로 다른 9개의 모델로 Output을 낸다고 보셔도 됩니다.
감사합니다.

DoDDeng
2020.12.16 00:37

Quantile 이란 발전량 확률분포에 대한 Percentile로 이해해도 되나요?

DACONIO
2020.12.16 10:19

안녕하세요. 데이콘입니다.
먼저 이번 대회에 관심을 가져주시고 적극적으로 참여해주셔서 감사드립니다.
확률분포라기 보다는 말 그대로 백분위로 이해하시면 됩니다. 예를 들어서 Quantile 값이 0.5라면 백분위 50%, 즉 중앙값(Median 값)이라고 보시면 됩니다. Quantile 값 0.5로 예측했다면, 아직 오지 않은 미래에 대해 중앙값이 이렇게 될 것이다라고 예측했다고 보시면 됩니다.
감사합니다.

최승연
2020.12.24 14:31

안녕하세요 Quantile 관련하여 질의있습니다.
지금 윗분들 질의 답에 보면 하나의 모델을 기반으로 총 9번의 예측을 하여 각 Quantile에 넣어주라고 하셨는데, 하나의 모델에 의해서 나온 결과 9개는 모두 같은 값으로 도출이 되게 됩니다. 이런 경우에는 단순 Quantile값만 바뀌게 되는거로 이해하는데 이 의미가 맞나요??

이전 글
이전 글이 존재하지 않습니다.
현재 글
[참고] 정답 양식과 Pinball loss에 대한 참고자료
Competition - 태양광 발전량 예측 AI 경진대회
Likes 5
Views 8,021
Comments 16
3년 전
다음 글
[참고] 태양광 발전량 예측 AI 경진대회 데이터 컬럼 설명
Competition - 태양광 발전량 예측 AI 경진대회
Likes 2
Views 7,010
Comments 0
3년 전