문장 유형 분류 AI 경진대회

알고리즘 | 언어 | 분류 | Weighted f1 Score

  • moneyIcon 상금 : 500 만원
  • 1,020명 마감

 

[Private 6th] klue/roberta-large + R-Drop Loss

2022.12.25 15:21 2,021 조회 language

검증해주실 때 참고 부탁드립니다!
저는 Python code를 작성해서 shell command를 입력해서 학습을 진행했습니다.
코드 공유에 올린 코드는 다른 분들이 제 코드를 쉽게 볼 수 있도록 제가 재구성했는데 python script 랑 ipynb에 의한 차이 때문인지 같은 과정 및 하이퍼파라미터여도 결과물이 달랐습니다. (python script으로는 private score가 똑같이 복원되는 것을 확인했습니다!)
검증을 해주실 때는 https://github.com/sangHa0411/skku-Sentence_Type_Classification 링크로 가주셔서 terminal에 있는 command를 확인해주시기 바랍니다.
개발 환경, GPU 등등 상세하게 적었습니다. 추가적으로 필요하신 게 있다면 말씀 부탁드립니다.

코드 설명
저는 이번 대회에 가장 큰 의의가 "불균형이 심한 데이터가 가지는 제한점을 어떻게 극복하고 모델 성능을 향상  시킬 것인가?" 라고 생각합니다.
실제로 이 목표를 달성하고 해당 문제에 대해서 해결 방안을 깨닫기 위해서 대회를 참가했습니다. 이 코드를 시간내서 봐주시는 분이 있으시다면 '해당 문제점을 해결하기 위해서 이사람은 이렇게 했구나' 이러한 점들을 봐주시면 정말 감사하겠습니다.
전체적인 코드를 보고싶으시면 https://github.com/sangHa0411/skku-Sentence_Type_Classification 에서 확인해주시면 감사합니다.

전체적인 키워드는 다음과 같습니다.
Data Augmentation + Under Sampling + Stratified Sampler

PDF
코드
로그인이 필요합니다
0 / 1000
도비콘
2022.12.25 20:02

🎄🎄🎄