제주도 도로 교통량 예측 AI 경진대회

위도, 경도 변수 처리 관련 질문

2022.10.21 08:32 3,424 Views

데이터 셋의 시작지점의 위도와 같은 공간좌표 값에 대해 하드코딩 및 레이블 인코딩하여 변수처리를 하는 것이 data leakage에 해당할까요?

지도 상의 좌표 값이 일반적으로 연속적인 값을 갖지만, 특정 도로상황이라는 특수한 환경에서의 데이터 수집이기에 몇몇 고유한 (이산적인) 좌표값으로 특정할 수 있다는 가정이 가능한지 질문드립니다.

로그인이 필요합니다
0 / 1000
DACONIO
2022.10.21 13:06

안녕하세요 난이제지쳤어요님 .

하드코딩 및 레이블 인코딩하여 변수처리를 하는 방법에 따라 달라질 수 있습니다.  test dataset의 정보를 활용한다면 Data Leakage에 해당됩니다. 

또한 대회 관련 문의는 토크 게시판의 "대회 관련 문의"게시판의 댓글로 해주시기 바라겠습니다 :)
https://dacon.io/competitions/official/235985/talkboard/406856?page=1&dtype=recent

감사합니다