분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
버스 운행시간 예측 AI 경진대회
데이터 셋을 확인했는데 next_arrive_time에 일반적이지 않게 큰 값이 있는 것을 확인했습니다. ...
데이터 셋을 확인했는데 next_arrive_time에 일반적이지 않게 큰 값이 있는 것을 확인했습니다.
이렇게 큰 값이 있을 때 RMSE를 Metric으로 사용하게 되면 큰 값을 상대오차 10%로만 틀려도 다른 작은 값을 완전히 틀리때와 비교했을 때 매우 큰 오차가 발생합니다.
이는 대회의 취지와 벗어난다고 생각해서 연락드립니다.
혹시 다른 Metric을 사용하실 생각은 없으신가요? e.g) MSLE
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요, JunhoSun님
train data에서의 next_arrive_time에서의 큰 값의 경우, 버스가 종점에 진입하는 경우 간혹 발생하는 오류로 확인이 되어있습니다.
이러한 값들이 존재하지만, 이를 처리 하는 것은 참가자분들의 몫임을 알려드립니다.
또한 지표인 RMSE에 대해서 좋은 의견을 내주셔서 정말로 감사드립니다만, 해당 지표를 선정하는 것은 저희 데이콘의 몫이며
충분한 내부 논의 끝에 해당 지표를 선정하였기 때문에, 해당 건의 사항은 이후 다른 대회들을 개최할 때, 참고할 만한 이야기로 정말 감사히 쓸 수 있을 것으로 보입니다.
하지만 현재 진행중인 대회에서는 RMSE를 그대로 사용할 예정임을 알려드립니다.