분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Public 4위, Private 15위] Tensorflow 딥러닝, KFold 과적합으로 인한 점수하락
(YOONSK 님의 코드 공유 글을 참고하고 작성된 코드입니다)
여기 Public 점수를 마지막날에 최대한 올리려다가 과적합으로 인해 15위까지 떨어진 한 남자가 있습니다.
바로 저구요
Fold 수를 5로 했을적에 1위를 잠깐 했었으나, 마지막 날 갑작스러운 순위 변동으로 3위까지 밀려나
Public 점수를 조금이라도 더 올리기 위해 KFold 교차검증에서 Fold 수를 줄인 것이 탈이었다고 생각됩니다.(일반화 성능 줄어들고 과적합 가능성 올라감)
물론 그것도 그렇고 파생변수들을 많이 만들어주었으면서
불필요한 feature들을 제거하지 않고 그대로 학습시켜 모델이 복잡해지기도 했고, 다중공선성에 영향을 받았다고도 볼 수 있을 것 같습니다.
제 방식이 옳았다고는 보기 힘들 수도 있겠지만, 어떻게 보면 반면교사 삼아서 공부하실 때 도움이 될 수 있다고 판단해서 코드 올립니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved