분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 14th/0.88895] R3F Loss, Back Translation
공동작성자
기존에 'JunsuLee'님이 올려주신 베이스라인을 수정하는 방식으로 진행하였습니다.
KLUE/RoBERTa-Large 모델을 Stratified 5-fold out soft voting ensemble으로 제출하였습니다.
추가 데이터셋으로는 KorNLI Dev, Test set/KLUE Official Dev Data를 사용하였습니다.
Data Augmentation으로는 'Kerry'님의 코드를 참고하여 원본 Train set에 Back Translation를 적용하였습니다.
Fine-tuning 시에 loss와 acc가 같이 증가하는 현상에 대해서 catastrophic forgetting 현상인지 의심이 들어서 추가 regularization을 적용하였습니다.
이 때 R3F Loss( https://arxiv.org/pdf/2008.03156.pdf)를 적용하였으며, 해당 Loss를 위한 hyperparameter는 단순 grid search를 시도했습니다.
팀원마다 모두 각자의 Colab 환경에서 시도하였으며, 이에 따라 code에 사용되는 directory path가 달라 실제 사용 시에는 path 확인을 부탁드리겠습니다.
KorNLI Dev, Test set: https://github.com/kakaobrain/KorNLUDatasets
KLUE Official Dev Data: https://aistages-prod-server-public.s3.amazonaws.com/app/Competitions/000068/data/klue-nli-v1.1.tar.gz
'JunsuLee'님의 코드: https://dacon.io/competitions/official/235875/codeshare/4520?page=1&dtype=recent
'Key'님의 코드: https://dacon.io/competitions/official/235747/codeshare/3054?page=1&dtype=recent
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved