월간 데이콘 뉴스 토픽 분류 AI 경진대회

[private 16위 / public 14위] Daon 팀

2021.08.12 22:53 5,347 조회 language

전체적인 파일 실행은 py파일을 사용했습니다.
Jupyter파일로 옮기는 과정에서 argparse를 일일히 바꿔주지 못했습니다.

저희는 klue-roberta-large를 사용했고, 10 fold / hard-voting을 최종으로 제출했습니다.
data augmentation도 여러방면으로 시도했는데 gpt3-kor-small_based_on_gpt2를 사용하여 0번 라벨 데이터를 증가해준 방법이 가장 효과가 좋았습니다.

코드
로그인이 필요합니다
0 / 1000
2미니
2022.12.04 20:04

안녕하세요. 늦게 댓글을 달아 보실지 모르겠지만, 문의드립니다. 
gpt_data.csv 가 무엇인지 확인 가능하실까요

JiNyan
2022.12.05 12:51

gpt_data.csv는 위에 augmentation한 데이터를 csv로 저장해서 사용한 파일입니다.