분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
데이터의 생성 시각만 보고도 정답 레이블을 예측할 수 있습니다
특정 레이블을 지닌 데이터 각각은 정확히 특정 시간대에서 생성되었습니다. 즉, 모든 데이터는 단순히 분절 마디만 찾으면 완벽하게 분류됩니다.
**그리고, 이는 테스트 데이터셋도 예외가 아닙니다.**
다만 이런 방식으로 만들어진 제출물이 대회의 취지에 부합하지는 않을 것 같네요.
'전처리 과정과 모델 학습/추론에서 비정상적인 테스트 데이터 정보 활용(Data Leakage) 시 규칙 위반에 해당합니다.'
해당 방법은 위 규칙에 위반이 될 거라 생각은 하는데...
이런 발상은 처음보네요 ㅎㅎㅎ... 하나 배워갑니다.
아무래도 말씀하신 것처럼 해당 방식으로 완벽하게 나눌 수 있다면, 허용해주진 않을 것 같은데 궁금하네요.
해당 내용은 본 대회에서 의도하는 정상적인 방법에서 벗어난 방법으로 활용이 불가능한 정보입니다.
- 정상적인 방법 : 이미지 파일 내 픽셀 데이터를 바탕으로 분류할 수 있어야합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Deleted Comment