분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 1위, 0.99155] LM_ko soft voting
안녕하세요 :)
Binary Classification 문제로 정의하여 분석을 진행했습니다.
총 3개의 한국어 언어 모델을 사용했습니다.
* single model
A) "jhgan/ko-sroberta-multitask" (public: 0.98939, private: 0.97987)
- optimizer=adamw, learning_rate=0.00003, batch_size=64, epochs=10, cv=5, seed=826
B) "kykim/bert-kor-base" (public: 0.98939, private: 0.98896)
- optimizer=adamw, learning_rate=0.00003, batch_size=64, epochs=10, cv=5, seed=826
C) "kykim/funnel-kor-base" (public: 0.98788, private: 0.98961)
- optimizer=adamw, learning_rate=0.00003, batch_size=32, epochs=10, cv=5, seed=826
* ensemble model (soft voting)
A + B 모델을 soft ensemble한 결과는 다음과 같습니다. (public: 0.99091, private: 0.98571)
A + C 모델을 soft ensemble한 결과는 다음과 같습니다. (public: 0.99091, private: 0.98701)
B + C 모델을 soft ensemble한 결과는 다음과 같습니다. (public: 0.99091, private: 0.99416)
* final model (soft voting)
최종 제출은 3가지 모델(A+B+C)을 soft ensemble 하였습니다. (public: 0.99091, private: 0.99156)
NVIDIA A100(40GB)을 사용하여 학습했습니다.
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved