분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 순위 95등 XGBoost, LightGBM 원-핫 인코딩 사용
데이터 전처리:
중앙값(median)을 사용하여 수치형 변수의 결측치 처리
최빈값(mode)을 사용하여 범주형 변수의 결측치 처리
날짜 데이터를 이용한 새로운 특성 생성 (게재년도, 게재월, 게재일차, 게재요일)
기존 특성을 활용한 새로운 특성 엔지니어링 (면적당월세, 층수비율, 보증금_월세_비율 등)
One-Hot Encoding을 통한 범주형 변수 처리
모델 학습:
다양한 모델을 사용한 앙상블 접근 (XGBoost, LightGBM, CatBoost, RandomForest, ExtraTrees)
StratifiedKFold (5-Fold) 교차검증 사용
StandardScaler를 사용한 특성 스케일링
SMOTE를 사용하여 데이터 불균형 해결
VotingClassifier를 통한 소프트 보팅 앙상블 적용
예측 및 평가:
ROC AUC Score를 사용한 모델 성능 평가
Out-of-Fold (OOF) 예측을 통한 과적합 방지
F1 Score 최적화를 위한 최적 임계값 탐색
테스트 데이터에 대한 최종 예측 및 CSV 파일 저장
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved