2024 제4회 K-water AI 경진대회 : 상수도 관망 이상 감지 AI 알고리즘 개발

알고리즘 | 시계열 | 정형 | 이상 탐지

 

대회 규칙 3에 대한 질문

2024.12.04 22:32 1,123 조회

규칙 3) 이상 감지 Threshold 설정

  • Threshold 설정 독립성: 이상 감지에 활용되는 Threshold는 다른 평가 데이터 샘플의 예측 결과 또는 Anomaly Score 등의 정보로부터 설정할 수 없습니다.
  • Threshold 설정 데이터 제한: Threshold 설정은 '학습 데이터' 또는 '현재 추론 중인 평가 데이터' 내에서만 이루어질 수 있습니다. 다른 평가 데이터 샘플에서 계산된 값을 활용하는 것은 불가능합니다.


여기서 '현재 추론 중인 평가 데이터' 에서도 설정할 수 있다는 것은 학습에 현재 추론 중인 test data를 쓸 수 있다는 것인가요?

예를들어, 현재 테스트 데이터 셋을 주어주면 자동으로 threshold를 설정하고 그 과정에서 주어진 평가 데이터를 비지도 학습에 사용하도록 코드를

짜도 data leakage에 해당되지 않는 것이라고 봐도 되나요?


로그인이 필요합니다
0 / 1000
DACON.GM
2024.12.05 09:17

이해 해주신 것과 같이 현재 추론 중인 평가 샘플 데이터를 이용한 Threshold 설정은 허용됩니다. 
다만, 이는 추론 단계에서의 설정 작업이어야 하며, 학습에 활용하는 것은 금지됩니다.

hyican
2024.12.05 16:49

답변 감사합니다. 하지만 threshold 설정 과정은 허용되지만 학습에  활용하는 것은 금지된다는 것이 무슨 뜻인지
이해가 잘 안됩니다 ㅠ 예를 들어 autoencoder를 평가 데이터 일부로 학습 시키고 threshold를 학습 결과를 바탕으로 설정하는 것은
허용되는 것일까요?

DACON.GM
2024.12.05 16:53

AutoEncoder 모델을 평가 데이터 일부로 학습시킬 수 없습니다.
평가 데이터는 모델 추론의 입력으로만 활용 가능합니다.
이상 감지를 위한 Threshold 설정은 모델 학습과는 별개의 과정이며, 
평가 샘플 데이터를 바탕으로 각각 추론 시에 Threshold를 설정하여 이상 감지를 수행한다면 추론 단계에서의 설정 작업이어야합니다.

hyican
2024.12.05 18:14

넵 답변 감사합니다