분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
대회 규칙 3에 대한 질문
규칙 3) 이상 감지 Threshold 설정
여기서 '현재 추론 중인 평가 데이터' 에서도 설정할 수 있다는 것은 학습에 현재 추론 중인 test data를 쓸 수 있다는 것인가요?
예를들어, 현재 테스트 데이터 셋을 주어주면 자동으로 threshold를 설정하고 그 과정에서 주어진 평가 데이터를 비지도 학습에 사용하도록 코드를
짜도 data leakage에 해당되지 않는 것이라고 봐도 되나요?
답변 감사합니다. 하지만 threshold 설정 과정은 허용되지만 학습에 활용하는 것은 금지된다는 것이 무슨 뜻인지
이해가 잘 안됩니다 ㅠ 예를 들어 autoencoder를 평가 데이터 일부로 학습 시키고 threshold를 학습 결과를 바탕으로 설정하는 것은
허용되는 것일까요?
AutoEncoder 모델을 평가 데이터 일부로 학습시킬 수 없습니다.
평가 데이터는 모델 추론의 입력으로만 활용 가능합니다.
이상 감지를 위한 Threshold 설정은 모델 학습과는 별개의 과정이며,
평가 샘플 데이터를 바탕으로 각각 추론 시에 Threshold를 설정하여 이상 감지를 수행한다면 추론 단계에서의 설정 작업이어야합니다.
넵 답변 감사합니다
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
이해 해주신 것과 같이 현재 추론 중인 평가 샘플 데이터를 이용한 Threshold 설정은 허용됩니다.
다만, 이는 추론 단계에서의 설정 작업이어야 하며, 학습에 활용하는 것은 금지됩니다.