AI vs Human 텍스트 판별 해커톤 -월간 데이콘 쇼츠

알고리즘 | 언어 | 분류 | 탐지

상금 : 인증서
252명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

[Private 1위, 0.99155] LM_ko soft voting

GNOEYHEAT

2023.10.31 16:38 1,299 조회 language

안녕하세요 :)

Binary Classification 문제로 정의하여 분석을 진행했습니다.
총 3개의 한국어 언어 모델을 사용했습니다.

* single model
A) "jhgan/ko-sroberta-multitask" (public: 0.98939, private: 0.97987)
- optimizer=adamw, learning_rate=0.00003, batch_size=64, epochs=10, cv=5, seed=826
B) "kykim/bert-kor-base" (public: 0.98939, private: 0.98896)
- optimizer=adamw, learning_rate=0.00003, batch_size=64, epochs=10, cv=5, seed=826
C) "kykim/funnel-kor-base" (public: 0.98788, private: 0.98961)
- optimizer=adamw, learning_rate=0.00003, batch_size=32, epochs=10, cv=5, seed=826

* ensemble model (soft voting)
A + B 모델을 soft ensemble한 결과는 다음과 같습니다. (public: 0.99091, private: 0.98571)
A + C 모델을 soft ensemble한 결과는 다음과 같습니다. (public: 0.99091, private: 0.98701)
B + C 모델을 soft ensemble한 결과는 다음과 같습니다. (public: 0.99091, private: 0.99416)

* final model (soft voting)
최종 제출은 3가지 모델(A+B+C)을 soft ensemble 하였습니다. (public: 0.99091, private: 0.99156)

NVIDIA A100(40GB)을 사용하여 학습했습니다.

감사합니다.

코드

댓글 0개

로그인이 필요합니다

comment

0 / 1000

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동하였습니다!

목록으로

이전 글이 존재하지 않습니다.

현재 글

[Private 1위, 0.99155] LM_ko soft voting

대회 - AI vs Human 텍스트 판별 해커톤 -월간 데이콘 쇼츠

7달 전

[private 3rd] Funnel | StratifiedKfold

대회 - AI vs Human 텍스트 판별 해커톤 -월간 데이콘 쇼츠

7달 전