train,valid,test 관련해서 질문 있습니다..!

2025.10.12 01:10 112 조회

안녕하세요, 제가 이전부터 계속 헷갈리는 부분이 있어서 혹시 고수분들께 도움 받을 수 있을까 싶어 글 남깁니다...

먼저 데이터에 대해 교차검증을 하지 않고 선형회귀를 하려고 합니다. 이 때, train에서 파생변수 생성이나 변수에 대한 비선형 변환을 하고자 하는데요. 이 때 변수의 특정 구간에 가중치를 주고자 validation으로 가중치 튜닝도 했습니다.

그런데 이때, train의 성능지표도 좋아지고, validation의 성능지표도 좋아지는데 test의 성능지표는 많이 하락합니다. test 데이터는 학습에 참고하면 안되는 것으로 알고 있는데, test 성능지표가 나빠졌다고 파생변수를 버려도 되는것인지, test는 최종 평가에만 사용하는 것이니 감수하는것인지가 너무 딜레마입니다.

test 데이터의 본질이 무엇인지, 성능이 안좋으면 모델을 다시 튜닝해야 하는 것인지, 그러면 test 자체가 오염되는 것 아닌지 도움 요청드립니다.

감사합니다..!

로그인이 필요합니다
0 / 1000
이힘찬
2025.10.14 14:18

train과 validation 성능은 좋아지는데 test 성능만 떨어진다는 것은 과적합 신호로 보입니다. 특히 validation 데이터로 가중치를 튜닝하셨다고 하셨는데, 이 과정에서 validation 데이터의 특성에 맞춰진 모델이 만들어졌을 수도 있습니다. 

test 데이터는 모델이 학습하지 않은 새로운 데이터로 모델의 일반화 성능을 평가할 수 있는 데이터입니다. test 데이터셋 결과가 좋지 않다는 것은 현재 모델 개발 방식에 문제가 있다는 신호로 받아들이시고, train-validation 단계로 돌아가서 전체 프로세스를 재검토하는 것이 일반적입니다. 정규화를 적용하거나, 파생변수를 단순화하거나, 교차검증으로 여러 validation 세트에서 성능을 확인하는 방식으로 검토하시면서 train과 validation 성능 차이를 모니터링 하시면 과적합 현상을 줄일 수 있습니다.

test 성능이 나쁘다고 파생변수를 버릴 필요는 없지만 test 결과를 보고 직접 수정해서도 안 됩니다. 정리하자면, test 결과가 좋지 않다면 train-validation 단계에서 과적합을 줄이는 방향으로 모델을 다시 개발하시면 좋을 거 같습니다!

atcas
2025.10.14 15:25

안녕하세요! 먼저 답변 주셔서 감사드립니다. 큰 도움이 되었습니다. 혹시 질문드리고 싶은게 있는데 모델이 비교적 잘 적합되어있어서 파생변수 생성시에 교차검증 성능이 아주 희박하게 좋아지는데 test는 크게 좋아지면 어떻게 받아들여야 하는건지 사용하는게 맞는건지 알 수 있을까요!

이힘찬
2025.10.14 16:01

안녕하세요! 실험을 열정적으로 하고 계신 거 같습니다. test만 크게 좋아진다면, 이건 조심스럽게 접근해야 할 상황입니다. 일반적으로 신뢰할 수 있는 파생변수는 교차검증에서 안정적으로 성능을 개선시키는 변수입니다. test에서만 크게 좋아진다는 것은 우연히 test 데이터의 특성과 맞아떨어졌을 가능성도 있기 때문입니다. 만약 그 파생변수가 우연히 대회의 test 데이터에서만 효과적이라면 운좋게 점수는 높게 나와서 수상할 수는 있겠지만, 다른 데이터에서 성능이 좋지 않다면 실제로 좋은 모델이라고 볼 수는 없겠죠? 다만 교차검증에서도 개선이 있었다면, 그 파생변수 자체가 나쁜 건 아닐 수 있습니다. 

atcas님이 어떤 목적으로 모델을 개발하시는지는 모르겠지만 대회 참여든 실무 활용이든, 결국 우리가 신뢰해야 하는 것은 교차검증 결과입니다. 대회라면 실제 평가 데이터가 우리가 가진 test와 다를 것이고, 실무라면 미래의 새로운 데이터에서도 잘 작동해야 하기 때문입니다. 수상도 중요하긴 하지만 데이터 전문가가 되시기 위해서는 교차검증을 통해 일관되게 성능이 좋은 모델을 개발하는 방향으로 연습하시는 것을 추천드립니다!

atcas
2025.10.14 16:29

제가 사용하는 데이터의 train mae는 2정도, test의 mae는 5정도로 분포 차이가 많이 나서 이 부분이 더욱 헷갈리는거 같습니다...
귀한 시간내어서 성심성의껏 답변주셔서 진심으로 감사드립니다! 정말 큰 도움이 되었습니다!