월간 데이콘 쇼츠 - 뉴스 기사 레이블 복구 해커톤

알고리즘 | 언어 | 분류 | 클러스터링 | 라벨링 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 474명 마감

 

[Private 3rd] Pseudo-labeling + roberta-large

2023.09.26 19:35 580 조회 language

규칙 6. 유의사항
이번 해커톤에 한하여 수기/Pseudo Labeling 허용
을 알차게 사용해 인간지능으로 수기 라벨링 1,000문장을 만들고, roberta-large로 학습시켜 다음 1,000개씩 추론해 검토하는 식으로 라벨을 늘렸습니다.
2만 문장까지 pesudo labeling 하고 돌렸으나, 제가 영어를 잘 못해서인지 성능이 떨어졌습니다.
1만 문장을 사용한게 제일 성능이 좋았습니다.
오랜만에 영어 공부 할 수 있어서 재밌었습니다.
감사합니다.
모두들 좋은 추석 되시고 건강하세요!

PDF
코드
로그인이 필요합니다
0 / 1000
딸기케이크
2023.09.27 18:29

pdf 뒤에 적어주신 '느낀점'이 공감가고 코드 잘 봤습니다. 감사합니다.

이세의인공지능
2023.09.27 18:47

재밌게 시작된 대회라 까불면서 느낀점을 마쳤습니다!
좋게 봐주셔서 감사합니다!