데이스쿨 할인 리턴-즈!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[0.81609] 전체 작업과정 base coding 공유 (via Optuna tuning)
dacon에서 도움 받았던 내용을 기반으로 코드 정리 등록합니다 :-)
1) 검증Val 샘플은 고정(동일한 샘플로 검증; random_state 값이 정해져 있는 상태) 해주고, 작업하면서 성능향상 변화를 비교체크
2) target(label) 데이터가 imbalanced 상태이므로 decision variance 영향를 균일화 하기 위해 샘플링 개선을 고려
이상, 제 의견입니다. 댓글 감사합니다 :-)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
궁금한게 있습니다.
저는 stratifiedKFold로 진행하고 있는데 0.71정도 나와서 제출했더니 0.8정도가 뜨는 것 같습니다. 반대로 밑에 예시 하나 들어준 것은 제 코드로는 0.68나왔고 최종은 0.81이 뜨고요.
이럴땐 대회를 어떻게 진행해야할까요? 학습데이터와 테스트데이터 차이가 큰데, 이것을 코드로 분석할 수가 있나요? 제출이 80회가 넘어가는 거보면 다들 수치정도만 바꿔보시는듯한 느낌이 들어서요