분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
안녕하세요! quantile이라는 것이 어떻게 채점되는지 아시나요?????
안녕하세요! 다들 어떻게 모델링하고 계신지 궁금합니다.
그 중에서도 리더보드의 채점을 어떻게 이해하고 계신지 궁금합니다.
저는 test0부터 80까지의 day7과 day8의 qauntile을 예측하기에 test의 quantile값(ex. .01 .02 .03 ... .09)마다
실제값이 존재한다고 알고 모델링을 진행하였는데, 데이콘측에서는 quantile별 실제 값은 존재하지 않는다고 하네요.
위의 세 가지 궁금증이 남는데요.
답을 알고계시는 분이 있다면 부담없이 댓글 남겨주시면 감사드리겠습니다!
감사합니다.
답변 감사합니다.
아 그러면 Weighted MAE라고 생각할 수도 있는건가용?
WMAE라고 생각할수도 있겠군요
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
정답은 여느 대회의 정답값처럼 존재할 것입니다. 하지만 분류도 아니고 회귀문제인데 정확한 그 값을 턱 예측해서 제출하는것도 쉽지 않겠지요?
지금 이런 문제를 예시를 들어 설명하자면,
정답이 10이라고 가정을 합시다. Quantile 0.1 에서의 예측값이 9라고 가정하면,
Loss : (10-9)*0.1 = 0.1
Quantile 0.9인 경우라면,
Loss : (10-9) * 0.9 = 0.9 가 될 것입니다.
이렇게 같은 값이라도 quantile 값에 따라서 점수가 달라집니다. 큰 quantile 값일수록, 정답보다 작게 예측한 경우에 많은 페널티를 주어서 정답보다 큰 값을 예측하도록 유도하고, 작은 quantile 일 수록 정답보다 크게 예측한 경우에 많은 페널티를 주어서 정답보다 작은 값을 예측하도록 유도합니다.
어떻게 보면 9개의 예측값을 이용해 '정답이 존재할 수 있는 범위'를 예측한다고 볼 수 있을 것 같습니다.
Quantile 값에 따른 비대칭형 MAE 라고 생각할 수 있을것 같기도 하고..
따라서 9개 열에 정답 데이터를 똑같이 넣고 제출하면 점수가 0.00이 나올 것입니다.
제가 이해하기로는 이런데, 이해가 되셨을지 모르겠습니다. 글로 쓰려니까 잘 안되네요...