분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[0.81609] 전체 작업과정 base coding 공유 (via Optuna tuning)
dacon에서 도움 받았던 내용을 기반으로 코드 정리 등록합니다 :-)
1) 검증Val 샘플은 고정(동일한 샘플로 검증; random_state 값이 정해져 있는 상태) 해주고, 작업하면서 성능향상 변화를 비교체크
2) target(label) 데이터가 imbalanced 상태이므로 decision variance 영향를 균일화 하기 위해 샘플링 개선을 고려
이상, 제 의견입니다. 댓글 감사합니다 :-)
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
궁금한게 있습니다.
저는 stratifiedKFold로 진행하고 있는데 0.71정도 나와서 제출했더니 0.8정도가 뜨는 것 같습니다. 반대로 밑에 예시 하나 들어준 것은 제 코드로는 0.68나왔고 최종은 0.81이 뜨고요.
이럴땐 대회를 어떻게 진행해야할까요? 학습데이터와 테스트데이터 차이가 큰데, 이것을 코드로 분석할 수가 있나요? 제출이 80회가 넘어가는 거보면 다들 수치정도만 바꿔보시는듯한 느낌이 들어서요