분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 15위] Deberta-v3-large
deberta-v3-large를 사용하되 RandomOverSampler를 사용해서 data augmentation을 해주고, SubsetRandomSampler를 사용해서 epoch를 쪼개줬습니다. pytorch-lightning을 사용하고 wandb로 log해줬습니다. colab과 kaggle을 사용해서 학습을 진행했습니다. 런타임 제한으로 충분한 학습을 못해서 아쉽습니다만, 다른 분들이 base 모델로도 좋은 성적을 거두신 것들을 보면서 많이 배웠습니다. 고생 많으셨습니다👏
모델 학습 및 추론 환경
- python : 3.7.12
- os : Linux-5.15.90+-x86_64-with-debian-bullseye-sid
- gpu : Tesla P100-PCIE-16GB
- pytorch-ligthning : 1.9.4
weight file link : https://drive.google.com/file/d/1ofhpGnuKJw3O4gu9RzMlGXBrdMdEqYMy/view
wandb link : https://wandb.ai/surdarla/ChatGPT-prompt/runs/y0fh47ga
notion pdf public link : https://surdarla.notion.site/surdarla/ChatGPT-submit-2356dc979fab4a3787d4416fa1a94044
(sharegpt를 확인해보고 싶으시면 notion링크에 들어가셔서 회색으로 된 부분을 눌러보시면 됩니다.)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved