분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
데이터의 생성 시각만 보고도 정답 레이블을 예측할 수 있습니다
특정 레이블을 지닌 데이터 각각은 정확히 특정 시간대에서 생성되었습니다. 즉, 모든 데이터는 단순히 분절 마디만 찾으면 완벽하게 분류됩니다.
**그리고, 이는 테스트 데이터셋도 예외가 아닙니다.**
다만 이런 방식으로 만들어진 제출물이 대회의 취지에 부합하지는 않을 것 같네요.
'전처리 과정과 모델 학습/추론에서 비정상적인 테스트 데이터 정보 활용(Data Leakage) 시 규칙 위반에 해당합니다.'
해당 방법은 위 규칙에 위반이 될 거라 생각은 하는데...
이런 발상은 처음보네요 ㅎㅎㅎ... 하나 배워갑니다.
아무래도 말씀하신 것처럼 해당 방식으로 완벽하게 나눌 수 있다면, 허용해주진 않을 것 같은데 궁금하네요.
해당 내용은 본 대회에서 의도하는 정상적인 방법에서 벗어난 방법으로 활용이 불가능한 정보입니다.
- 정상적인 방법 : 이미지 파일 내 픽셀 데이터를 바탕으로 분류할 수 있어야합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다