분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
k-fold cross validation에서 validation set의 역할에 관해 질문드립니다
안녕하세요
현재 제가 읽고 있는 논문에서 제안하는 딥러닝 모델 방법론을 직접 구현해서 성능을 도출해보려하는데,
데이터 분할에서 잘 모르는 부분이 있어 질문드립니다.
제가 보고 있는 논문에서는 k-fold cross validation을 활용해서 모델 성능 평가를 진행하며 train set으로 모델 학습, validation set으로 모델 성능 평가를 진행하고 있습니다. (test set 언급은 없으며, 전체 데이터셋을 train/validation set으로 분할한다고만 명시하고 있습니다)
그런데 이때 validation set을 활용해서 학습된 모델의 성능 평가를 하는 것 뿐만 아니라 각 epoch마다 validation loss까지 계산에 활용하고 있어 이 부분이 잘 이해가 되지 않습니다.
보통 validation set을 loss 계산에 사용하는 이유는 모델 학습시 train set에 과적합되는 것을 방지하고 validation loss를 기준으로 best model을 선정하기 위함이라고 알고있습니다만,
혹시 해당 논문에서 validation set을 best model을 선정하는 데에 활용되지 않고 validation loss 계산과 성능 평가에 활용한다면,
이러한 validation set의 활용 방법이 k-fold cross validation에서 타당한 방법이 될 수 있는지 궁금합니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved