서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
제주도 도로 교통량 예측 AI 경진대회
위도, 경도 변수 처리 관련 질문
데이터 셋의 시작지점의 위도와 같은 공간좌표 값에 대해 하드코딩 및 레이블 인코딩하여 변수처리를 하는 것이 data leakage에 해당할까요?
지도 상의 좌표 값이 일반적으로 연속적인 값을 갖지만, 특정 도로상황이라는 특수한 환경에서의 데이터 수집이기에 몇몇 고유한 (이산적인) 좌표값으로 특정할 수 있다는 가정이 가능한지 질문드립니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 난이제지쳤어요님 .
하드코딩 및 레이블 인코딩하여 변수처리를 하는 방법에 따라 달라질 수 있습니다. test dataset의 정보를 활용한다면 Data Leakage에 해당됩니다.
또한 대회 관련 문의는 토크 게시판의 "대회 관련 문의"게시판의 댓글로 해주시기 바라겠습니다 :)
https://dacon.io/competitions/official/235985/talkboard/406856?page=1&dtype=recent
감사합니다