생성 AI ChatGPT 활용 AI 경진대회 월간 데이콘

알고리즘 | ChatGPT | 프롬프트 엔지니어링 | 언어 | 분류 | Macro F1 Score

  • moneyIcon 인증서
  • 1,239명 마감

 

TF-IDF + LR/SVC 앙상블 뉴스 분류 (Macro F1 0.88)

2026.03.09 12:28 253 조회 language

영문 뉴스 기사를 8개 카테고리로 분류하는 TF-IDF 기반 앙상블 모델입니다.

[전처리]
- 소문자 변환, URL/이메일 제거, 특수문자 제거

[특징 추출]
- TF-IDF (bigram, max_features=50000, sublinear_tf)

[모델]
- Logistic Regression (C=10, class_weight=balanced)
- LinearSVC + CalibratedClassifierCV (확률 추정)
- 두 모델의 소프트 보팅 앙상블

[결과]
- 검증 Macro F1 Score: 0.8796
- 클래스 불균형 대응: class_weight=balanced 적용

코드