분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 8위]klue_bert_base+ 멀티라벨Loss + Gridsearch cv + 앙상블
안녕하세요
public 32위여서 생각도 못학도 있었는데 앙상블 덕분에 private에서 높은 점수를 기록한 것 같습니다
Dacon과 선배님들의 코드를 통해 많이 배웠고, 처음 10 위권에 진입하여 감개가 무량합니다
klue_bert_base 를 기반으로 multi-label loss를 활용하였고, KorEDA (https://github.com/catSirup/KorEDA) 통하여 훈련과정에서 데이터에 변주를 주어 과적합을 막고자 하였습니다
class 중 하나라도 틀리면 오답으로 설정하여 모든 class에 대한 f1-score를 metric으로 한 것이 비교적 간단한 모델로 높은 점수를 기록한 주요인이었다고 생각합니다
hyper parameter가 많기 때문에 grid-search cv를 구현하여 최적의 parameter를 도출하고자 하였습니다
제출 코드에는 최적 parameter만 적었습니다
원래는 함수들이 파이썬 py에 따로 저장되어 있으나 ipynb로 풀어서 제출합니다
자세한 코드 및 데이터 구조는 git-hub (https://github.com/steve-yskim/Dacon_text_classification) 참조해주세요
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved