분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 2nd] muppet-roberta-large + k-fold
공동작성자
안녕하세요 시장님과 커피챗 팀입니다.
데이터 전처리는 여러 실험 끝에 성능이 떨어지는 것을 확인, 전처리 진행은 하지 않았습니다.
Train 데이터를 5개로 split 하여 Stratified k-fold로 학습시켜 5개의 모델을 저장하였습니다.
5개의 모델이 inference한 csv file 5개를 hard voting 시켜서 정확도를 높였습니다.
Fold는 생성된 split 폴더에서 0부터 4번까지 학습시켜야 합니다. 코드에는 0fold만 기재되어 있는 점 참고 부탁드립니다. 이미 학습한 모델의 weight값은 https://drive.google.com/drive/folders/1fH6wUjx5YWMI1JWU1MCf2l2nKE11Y3o1?usp=share_link 에서 다운받아서 inference에 사용하실 수 있습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved