분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 6th] klue/roberta-large + R-Drop Loss
검증해주실 때 참고 부탁드립니다!
저는 Python code를 작성해서 shell command를 입력해서 학습을 진행했습니다.
코드 공유에 올린 코드는 다른 분들이 제 코드를 쉽게 볼 수 있도록 제가 재구성했는데 python script 랑 ipynb에 의한 차이 때문인지 같은 과정 및 하이퍼파라미터여도 결과물이 달랐습니다. (python script으로는 private score가 똑같이 복원되는 것을 확인했습니다!)
검증을 해주실 때는 https://github.com/sangHa0411/skku-Sentence_Type_Classification 링크로 가주셔서 terminal에 있는 command를 확인해주시기 바랍니다.
개발 환경, GPU 등등 상세하게 적었습니다. 추가적으로 필요하신 게 있다면 말씀 부탁드립니다.
코드 설명
저는 이번 대회에 가장 큰 의의가 "불균형이 심한 데이터가 가지는 제한점을 어떻게 극복하고 모델 성능을 향상 시킬 것인가?" 라고 생각합니다.
실제로 이 목표를 달성하고 해당 문제에 대해서 해결 방안을 깨닫기 위해서 대회를 참가했습니다. 이 코드를 시간내서 봐주시는 분이 있으시다면 '해당 문제점을 해결하기 위해서 이사람은 이렇게 했구나' 이러한 점들을 봐주시면 정말 감사하겠습니다.
전체적인 코드를 보고싶으시면 https://github.com/sangHa0411/skku-Sentence_Type_Classification 에서 확인해주시면 감사합니다.
전체적인 키워드는 다음과 같습니다.
Data Augmentation + Under Sampling + Stratified Sampler
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
🎄🎄🎄