분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
HAICon2020 산업제어시스템 보안위협 탐지 AI 경진대회
data leakage issue
1. 대회 규칙
예) 검증 데이터셋 내에 있는 정상 데이터를 일부 샘플링하여 학습에 사용하는 경우 등
2. 주어진 데이터셋
3. 이슈
의도하신 대회 규칙과 실제 데이터셋간에 차이가 있는것 같아 이슈로 올립니다. 확인 부탁드려요. 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요.
같은 파일 내에서만 data laekage 문제가 없으면 됩니다.
모델 학습 및 예측시 파일 사이의 data leakage 문제는 없습니다.
ex)
동일 test파일 예측시 17:23:04 데이터를 활용해 17:23:03 예측 (X)
2020년 7월 12일 train데이터로 학습 시킨 모델을 이용해 test파일 2020년7월 11일 예측 (O)