분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
위도, 경도 변수 처리 관련 질문
데이터 셋의 시작지점의 위도와 같은 공간좌표 값에 대해 하드코딩 및 레이블 인코딩하여 변수처리를 하는 것이 data leakage에 해당할까요?
지도 상의 좌표 값이 일반적으로 연속적인 값을 갖지만, 특정 도로상황이라는 특수한 환경에서의 데이터 수집이기에 몇몇 고유한 (이산적인) 좌표값으로 특정할 수 있다는 가정이 가능한지 질문드립니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 난이제지쳤어요님 .
하드코딩 및 레이블 인코딩하여 변수처리를 하는 방법에 따라 달라질 수 있습니다. test dataset의 정보를 활용한다면 Data Leakage에 해당됩니다.
또한 대회 관련 문의는 토크 게시판의 "대회 관련 문의"게시판의 댓글로 해주시기 바라겠습니다 :)
https://dacon.io/competitions/official/235985/talkboard/406856?page=1&dtype=recent
감사합니다