분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 2nd] muppet-roberta-large + k-fold
공동작성자
안녕하세요 시장님과 커피챗 팀입니다.
데이터 전처리는 여러 실험 끝에 성능이 떨어지는 것을 확인, 전처리 진행은 하지 않았습니다.
Train 데이터를 5개로 split 하여 Stratified k-fold로 학습시켜 5개의 모델을 저장하였습니다.
5개의 모델이 inference한 csv file 5개를 hard voting 시켜서 정확도를 높였습니다.
Fold는 생성된 split 폴더에서 0부터 4번까지 학습시켜야 합니다. 코드에는 0fold만 기재되어 있는 점 참고 부탁드립니다. 이미 학습한 모델의 weight값은 https://drive.google.com/drive/folders/1fH6wUjx5YWMI1JWU1MCf2l2nKE11Y3o1?usp=share_link 에서 다운받아서 inference에 사용하실 수 있습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved