모델 튜닝 챌린지 : 월간 데이콘 파일럿

알고리즘 | 정형 | 하이퍼파라미터 | 모델 튜닝 | 노코딩 | AUC

  • moneyIcon Prize : 인증서 + 데이스쿨
  • 475명 마감

 

[0.81609] 전체 작업과정 base coding 공유 (via Optuna tuning)

2024.04.04 18:27 384 Views language

dacon에서 도움 받았던 내용을 기반으로 코드 정리 등록합니다 :-)

Code
로그인이 필요합니다
0 / 1000
Idea경진대회
2024.04.04 22:36

궁금한게 있습니다.
저는 stratifiedKFold로 진행하고 있는데 0.71정도 나와서 제출했더니 0.8정도가 뜨는 것 같습니다. 반대로 밑에 예시 하나 들어준 것은 제 코드로는 0.68나왔고 최종은 0.81이 뜨고요.

이럴땐 대회를 어떻게 진행해야할까요? 학습데이터와 테스트데이터 차이가 큰데, 이것을 코드로 분석할 수가 있나요? 제출이 80회가 넘어가는 거보면 다들 수치정도만 바꿔보시는듯한 느낌이 들어서요

프리랜Seo
2024.04.05 14:42

1) 검증Val 샘플은 고정(동일한 샘플로 검증; random_state 값이 정해져 있는 상태) 해주고, 작업하면서 성능향상 변화를 비교체크
2) target(label) 데이터가 imbalanced 상태이므로 decision variance 영향를 균일화 하기 위해 샘플링 개선을 고려

이상, 제 의견입니다. 댓글 감사합니다  :-)