분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
검증 데이터셋 활용 규칙 관련 문의입니다.
https://dacon.io/competitions/official/235624/talkboard/401378?page=1&dtype=recent&ptype=pub
위 토론에서 답글 남겨주신 것에 대해 애매한 부분이 있어 비슷한 문의드립니다.
해당 답글에 따르면 다음과 같은 규칙인 것으로 보입니다.
그렇다면 예를 들어 validation dataset 을 분석하여 어떤 insight를 얻은 후,
train set 의 특정 feature 에 weight 을 주거나, 혹은 새로운 feature 를 만들어서 추가하는 등의 작업은 가능한 것인가요?
('특정 feature engineering 을 하는 공식'만 validation set 을 통해 만들어내고, validation data 를 직접 사용하지는 않는 형태)
구체적으로 예를 들면, 만약 validation set 을 분석해서 attack 을 판별할 때 '3번째 칼럼의 제곱'이 매우 중요하다는 insight 를 얻게 되었다면 학습 시에 train set 에 '3번째 칼럼의 제곱' 칼럼을 새로 추가한 후 Model 학습에 사용해도 괜찮은 것인가요?
사용해도 될 것으로 보이지만 혹시나해서 문의드립니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 스마일님.
언급하신 예시와 같은 상황에서 validation set 사용이 가능합니다.
감사합니다.
데이콘 드림.