분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 8위]klue_bert_base+ 멀티라벨Loss + Gridsearch cv + 앙상블
안녕하세요
public 32위여서 생각도 못학도 있었는데 앙상블 덕분에 private에서 높은 점수를 기록한 것 같습니다
Dacon과 선배님들의 코드를 통해 많이 배웠고, 처음 10 위권에 진입하여 감개가 무량합니다
klue_bert_base 를 기반으로 multi-label loss를 활용하였고, KorEDA (https://github.com/catSirup/KorEDA) 통하여 훈련과정에서 데이터에 변주를 주어 과적합을 막고자 하였습니다
class 중 하나라도 틀리면 오답으로 설정하여 모든 class에 대한 f1-score를 metric으로 한 것이 비교적 간단한 모델로 높은 점수를 기록한 주요인이었다고 생각합니다
hyper parameter가 많기 때문에 grid-search cv를 구현하여 최적의 parameter를 도출하고자 하였습니다
제출 코드에는 최적 parameter만 적었습니다
원래는 함수들이 파이썬 py에 따로 저장되어 있으나 ipynb로 풀어서 제출합니다
자세한 코드 및 데이터 구조는 git-hub (https://github.com/steve-yskim/Dacon_text_classification) 참조해주세요
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved