Dacon Monthly ChatGPT Utilization Generative AI Competition

Algorithm | ChatGPT | Prompt Engineering | NLP | Classification | Macro F1 Score

  • moneyIcon Certification
  • 1,226 Users Completed

 

TF-IDF + LR/SVC 앙상블 뉴스 분류 (Macro F1 0.88)

2026.03.09 12:28 57 Views language

영문 뉴스 기사를 8개 카테고리로 분류하는 TF-IDF 기반 앙상블 모델입니다.

[전처리]
- 소문자 변환, URL/이메일 제거, 특수문자 제거

[특징 추출]
- TF-IDF (bigram, max_features=50000, sublinear_tf)

[모델]
- Logistic Regression (C=10, class_weight=balanced)
- LinearSVC + CalibratedClassifierCV (확률 추정)
- 두 모델의 소프트 보팅 앙상블

[결과]
- 검증 Macro F1 Score: 0.8796
- 클래스 불균형 대응: class_weight=balanced 적용

Code
Previous
No Previous Post
Current
TF-IDF + LR/SVC 앙상블 뉴스 분류 (Macro F1 0.88)
Competition - 생성 AI ChatGPT 활용 AI 경진대회 월간 데이콘
Likes 0
Views 57
Comments 0
12일 전
Next
[Private 2위] DeBERTa with Label Smoothing Loss
Competition - 생성 AI ChatGPT 활용 AI 경진대회 월간 데이콘
Likes 12
Views 5,225
Comments 2
3년 전