로그 분석을 통한 보안 위험도 예측 AI 경진대회

알고리즘 | NLP | 분류 | 제어 | Macro f1 score

  • moneyIcon Prize : 총 300만원
  • 727명 마감

 

패턴 매칭 및 Data leakage에 해당하는지 궁금합니다!

작성자 비공개
2021.04.26 20:57 1,416 Views

TEST 데이터만 존재하는 level 7을 걸러내기 위해서 TEST셋에서 군집화 같은 방법으로 7을 제외시키고 나서 나머지는 베이스라인과 같은 지도학습으로 접근해도 되는지 궁금합니다. (패턴 매칭 및 Data leakage 에 해당하는지 궁금합니다.)

로그인이 필요합니다
0 / 1000
DACONIO
2021.12.24 11:28

안녕하세요. 작성자님

테스트셋은 추론 과정에서만 사용 가능하며 테스트셋을 이용한 처리는 data leakage에 해당합니다.
본 경진대회에서는 평가를 위해 테스트 데이터가 데이터셋의 형태로 제공합니다.
하지만 실서비스 단계에서 개별 데이터에 대해 적용이 가능해야 합니다.

감사합니다.
데이콘 드림