분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
|public 0.894| +Klue-dev + R-drop + Ensemble
## KLUE-NLI 실험 공유 | Cartography, R-Drop, Ensemble 적용 후기
안녕하세요!
이번 한국어 문장 관계 분류(KLUE-NLI) 대회에서 성능 개선을 위해 여러 실험을 진행한 내용을 정리해 공유합니다.
주요 내용은 다음과 같습니다.
* ✅ Dataset Cartography 기반 샘플 선별 및 데이터 증강
* ✅ KLUE-dev 활용과 Random Sampling 비교
* ✅ R-Drop 계수(α)별 성능 비교
* ✅ Soft Voting / Hard Voting 앙상블 실험
특히 **Cartography로 선별한 751개 샘플만으로 KLUE-dev 전체 3,000개를 사용한 것과 거의 유사한 성능을 확인**했고, **R-Drop과 앙상블 조합을 통해 최종 Leaderboard 0.894**를 달성했습니다.
단순히 결과만 공유하는 것이 아니라, **무엇이 효과가 있었고 무엇은 기대만큼 효과가 없었는지까지** 함께 정리했습니다.
관심 있으신 분들은 아래 노션에서 자세한 실험 과정과 결과를 확인해 보세요. 피드백이나 의견도 환영합니다!
노션 링크 : https://woans0104.notion.site/4-final-37e031f36912805c8ab3dba80ecb3772?source=copy_link
git 링크 : https://github.com/jmoonxai/NLP-Study/tree/main/Korean_NLI
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved