부동산 허위매물 분류 해커톤: 가짜를 색출하라!

데이콘 해커톤 | 알고리즘 | 정형 | 분류 | 허위매물 | Macro F1 Score

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 1,065명 마감

 

public 51위, private 61위(0.84627) LightGBM

2025.02.06 20:31 1,623 조회 language

📌 설명
• 데이터 전처리:
   - KNN Imputer로 결측치 보완
   - Label Encoding 및 One-Hot Encoding 적용
   - SMOTE를 사용하여 데이터 불균형 해결
• 모델 학습:
   - LightGBM (LGBMClassifier) 적용
   - StratifiedKFold (5-Fold) 교차검증 사용
   - F1 Score 최적화를 위한 하이퍼파라미터 튜닝
   - Early Stopping 적용 (최적 epoch 자동 선택)
• 예측 및 저장:
   - 최적 모델의 OOF F1 Score 출력
   - 테스트 데이터 예측 및 CSV 저장

코드