[1주년 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
HD현대 AI Challenge
데이터 관련 질문
변수 중 DIST는 정박지(ber_port)와 접안지 사이의 거리이므로 DIST가 0이면 CI_HOUR(접안 전에 선박이 해상에 정박하는 시간) 역시 0인 것으로 생각이 되는데, 그렇지 않은 데이터가 존재합니다. (DIST는 0이나, CI_HOUR는 0이 아님, 이때 CI_HOUR 평균 103시간 정도)
노이즈나 human error가 포함된건지 궁금합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
노이즈인지 human error인지 모르겠지만,
Test 데이터셋에서 Dist 0인 데이터에 대해 추론한 CI_HOUR을 0으로 교체하여 제출하니 MAE가 소폭 하락하긴 하더라구요...