AI vs Human 텍스트 판별 해커톤 -월간 데이콘 쇼츠

알고리즘 | 언어 | 분류 | 탐지

  • moneyIcon 상금 : 인증서
  • 252명 마감

 

[Private 5th] KoELECTRA + KLUE-RoBERTa

2023.10.30 11:37 858 조회 language

이번 대회를 통해 자연어 처리에 대해 많이 배우게 된 계기가 되었습니다.
다들 모두 고생 많으셨습니다!

<Summary>
1. 전처리 : 특수 문자 제거, 띄어쓰기 교정
2. 기존 DataFrame 형태 변환 (Train에 1, 2, 3, 4 로 라벨링 된 데이터를 0, 1 이진 분류 형태로) 
3. KoELECTRA, KLUE-RoBERTa 활용 (실험 결과 다른 모델에 비해 output이 좋았음)
4. 문장 별 예측된 확률값을 각각 6:4 비율로 조정하여 합친 후, 최종 결과 제출

PDF
코드