2023 용인시 SW/AI 해커톤

용인시 | 알고리즘 | 언어 | 분류 | Macro F1 Score

상금 : 총 500만원
112명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

[Private 2nd] muppet-roberta-large + k-fold

jinnyfruit

공동작성자

2023.10.20 20:45 441 조회 language

안녕하세요 시장님과 커피챗 팀입니다.
데이터 전처리는 여러 실험 끝에 성능이 떨어지는 것을 확인, 전처리 진행은 하지 않았습니다.
Train 데이터를 5개로 split 하여 Stratified k-fold로 학습시켜 5개의 모델을 저장하였습니다.
5개의 모델이 inference한 csv file 5개를 hard voting 시켜서 정확도를 높였습니다.

Fold는 생성된 split 폴더에서 0부터 4번까지 학습시켜야 합니다. 코드에는 0fold만 기재되어 있는 점 참고 부탁드립니다. 이미 학습한 모델의 weight값은 https://drive.google.com/drive/folders/1fH6wUjx5YWMI1JWU1MCf2l2nKE11Y3o1?usp=share_link 에서 다운받아서 inference에 사용하실 수 있습니다.

코드