DASCHOOL! Fall Special Discount
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
HD현대 AI Challenge
데이터 관련 질문
변수 중 DIST는 정박지(ber_port)와 접안지 사이의 거리이므로 DIST가 0이면 CI_HOUR(접안 전에 선박이 해상에 정박하는 시간) 역시 0인 것으로 생각이 되는데, 그렇지 않은 데이터가 존재합니다. (DIST는 0이나, CI_HOUR는 0이 아님, 이때 CI_HOUR 평균 103시간 정도)
노이즈나 human error가 포함된건지 궁금합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
노이즈인지 human error인지 모르겠지만,
Test 데이터셋에서 Dist 0인 데이터에 대해 추론한 CI_HOUR을 0으로 교체하여 제출하니 MAE가 소폭 하락하긴 하더라구요...