2023 용인시 SW/AI 해커톤

Algorithm | NLP | Classification | Macro F1 Score

5,000,000 KRW
126 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

[Private 2nd] muppet-roberta-large + k-fold

꼬질이

공동작성자

2023.10.20 20:45 2,092 Views language

안녕하세요 시장님과 커피챗 팀입니다.
데이터 전처리는 여러 실험 끝에 성능이 떨어지는 것을 확인, 전처리 진행은 하지 않았습니다.
Train 데이터를 5개로 split 하여 Stratified k-fold로 학습시켜 5개의 모델을 저장하였습니다.
5개의 모델이 inference한 csv file 5개를 hard voting 시켜서 정확도를 높였습니다.

Fold는 생성된 split 폴더에서 0부터 4번까지 학습시켜야 합니다. 코드에는 0fold만 기재되어 있는 점 참고 부탁드립니다. 이미 학습한 모델의 weight값은 https://drive.google.com/drive/folders/1fH6wUjx5YWMI1JWU1MCf2l2nKE11Y3o1?usp=share_link 에서 다운받아서 inference에 사용하실 수 있습니다.

Code