문장 유형 분류 AI 경진대회

알고리즘 | 언어 | 분류 | Weighted f1 Score

  • moneyIcon 상금 : 500 만원
  • 1,049명 마감

 

[Private 8위]klue_bert_base+ 멀티라벨Loss + Gridsearch cv + 앙상블

2023.01.04 21:49 2,482 조회 language

안녕하세요

public 32위여서 생각도 못학도 있었는데 앙상블 덕분에 private에서 높은 점수를 기록한 것 같습니다
Dacon과 선배님들의 코드를 통해 많이 배웠고, 처음 10 위권에 진입하여 감개가 무량합니다

klue_bert_base 를 기반으로 multi-label loss를 활용하였고, KorEDA (https://github.com/catSirup/KorEDA) 통하여  훈련과정에서 데이터에 변주를 주어 과적합을 막고자 하였습니다
class 중 하나라도 틀리면 오답으로 설정하여 모든 class에 대한 f1-score를 metric으로 한 것이 비교적 간단한 모델로 높은 점수를 기록한 주요인이었다고 생각합니다
hyper parameter가 많기 때문에 grid-search cv를 구현하여 최적의 parameter를 도출하고자 하였습니다
제출 코드에는 최적 parameter만 적었습니다

원래는 함수들이 파이썬 py에 따로 저장되어 있으나 ipynb로 풀어서 제출합니다
자세한 코드 및 데이터 구조는 git-hub (https://github.com/steve-yskim/Dacon_text_classification) 참조해주세요

코드
이전 글
이전 글이 존재하지 않습니다.
현재 글
[Private 8위]klue_bert_base+ 멀티라벨Loss + Gridsearch cv + 앙상블
대회 - 문장 유형 분류 AI 경진대회
좋아요 8
조회 2,482
댓글 0
2년 전
다음 글
Klue + pytorch 베이스라인 & 코드설명
대회 - 문장 유형 분류 AI 경진대회
좋아요 47
조회 6,096
댓글 3
2년 전