AI vs Human 텍스트 판별 해커톤 -월간 데이콘 쇼츠

알고리즘 | 언어 | 분류 | 탐지

  • moneyIcon 상금 : 인증서
  • 252명 마감

 

[private 3rd] Funnel | StratifiedKfold

2023.10.31 12:14 661 조회 language

안녕하세요, 율동공원입니다.
이번 월간 데이콘 문제는 Natural Language Classification으로 접근하였습니다.

모델은 사전학습된 ‘kykim/funnel-kor-base’ 를 사용하였습니다.
데이터 처리 단계에서 핵심은 binary classification으로 변환하여 학습의 판별 성능을 향상 시킨 것입니다.
검증 전략은 stratified kfold를 사용하여 단일 모델 앙상블로 진행하였으며
모델링은 [데이콘 Basic 쇼핑몰 리뷰 평점 분류 경진대회] private 1위 롤케잌님과
[월간 데이콘 법원 판결 예측 AI 경진대회] private 4위 GNOEYHEAT님을 참고하였습니다.

학습 환경은 NVIDIA RTX A6000로 진행하였습니다.

감사합니다.

코드