HAICon2020 산업제어시스템 보안위협 탐지 AI 경진대회

알고리즘 | 정형 | 이상탐지 | 제어 | TaPR

  • moneyIcon 상금 : 총 2,000만원
  • 1,254명 마감

 

검증 데이터셋 활용 규칙 관련 문의입니다.

2020.09.11 15:02 3,078 조회

https://dacon.io/competitions/official/235624/talkboard/401378?page=1&dtype=recent&ptype=pub


위 토론에서 답글 남겨주신 것에 대해 애매한 부분이 있어 비슷한 문의드립니다.


해당 답글에 따르면 다음과 같은 규칙인 것으로 보입니다.

  • 모델 학습 시에는 사용 불가
  • train set 만으로 학습한 모델을 얻은 후, validation set 으로 검증 과정을 통해 hyperparameter 등을 조절하며 학습 모델을 조금씩 변경하는 데는 사용 가능



그렇다면 예를 들어 validation dataset 을 분석하여 어떤 insight를 얻은 후,

train set 의 특정 feature 에 weight 을 주거나, 혹은 새로운 feature 를 만들어서 추가하는 등의 작업은 가능한 것인가요?

('특정 feature engineering 을 하는 공식'만 validation set 을 통해 만들어내고, validation data 를 직접 사용하지는 않는 형태)


구체적으로 예를 들면, 만약 validation set 을 분석해서 attack 을 판별할 때 '3번째 칼럼의 제곱'이 매우 중요하다는 insight 를 얻게 되었다면 학습 시에 train set 에 '3번째 칼럼의 제곱' 칼럼을 새로 추가한 후 Model 학습에 사용해도 괜찮은 것인가요?


사용해도 될 것으로 보이지만 혹시나해서 문의드립니다.

로그인이 필요합니다
0 / 1000
DACONIO
2021.12.24 16:24

안녕하세요 스마일님.

언급하신 예시와 같은 상황에서 validation set 사용이 가능합니다.

감사합니다.
데이콘 드림.

스마일
2020.09.11 16:25

넵 답변 감사합니다