분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
HAICon2020 산업제어시스템 보안위협 탐지 AI 경진대회
data leakage issue
1. 대회 규칙
예) 검증 데이터셋 내에 있는 정상 데이터를 일부 샘플링하여 학습에 사용하는 경우 등
2. 주어진 데이터셋
3. 이슈
의도하신 대회 규칙과 실제 데이터셋간에 차이가 있는것 같아 이슈로 올립니다. 확인 부탁드려요. 감사합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요.
같은 파일 내에서만 data laekage 문제가 없으면 됩니다.
모델 학습 및 예측시 파일 사이의 data leakage 문제는 없습니다.
ex)
동일 test파일 예측시 17:23:04 데이터를 활용해 17:23:03 예측 (X)
2020년 7월 12일 train데이터로 학습 시킨 모델을 이용해 test파일 2020년7월 11일 예측 (O)