분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[private 9.9261] 코드 공유
공동작성자
시계열 특성 공학, 멀티 모델 앙상블를 결합하여 예측 성능(MAE)을 극대화했습니다.
가독성을 위해 사용한 파일들을 깃허브에 정리했습니다. README에 정리한 파일 순서대로 실행하면 됩니다
https://github.com/jwlee7321-cpu/AI-Competition-to-Predict-Delays-in-Smart-Warehouse-Shipment.git
1. 주요 파이프라인 구성
Feature Engineering: layout_info를 결합하고, 시나리오별 타임슬롯 기반의 Lag/Lead, Rolling, Context 피처를 생성하여 공정 흐름의 맥락을 반영했습니다.
Base Ensemble (v12): LightGBM, XGBoost, CatBoost를 활용하였으며, GroupKFold와 다양한 타겟 변환/목적 함수를 적용해 모델의 범용성을 높였습니다.
Future Proxy/Stack: 향후 운영 흐름을 예측에 반영하기 위해 Future Proxy 모델을 구축하고, 이를 스태킹하여 미래 시점의 정보 손실을 보완했습니다.
2. 최적화 및 앙상블 전략
Portfolio Blend: 기초 모델(v12)과 미래 예측 모델(Future Stack)을 3:7 비율로 블렌딩하여 안정적인 성능을 확보했습니다.
sub_port_v28_w70 = 0.30 * v12 + 0.70 * future_stack
Late Postprocess (A120): 잔차(Residual)의 방향성을 분석하여 최종 스코어를 개선했습니다.
Final = Blend - 1.20 * (Calibration_Ref - Blend)
3. 결론 및 재현
제공된 GitHub 저장소 내의 py코드를 통해 전처리부터 최종 단계까지의 산출물을 재현할 수 있도록 구성했습니다.
아래의 ipynb 파일은 간단하게 코드 로직을 요약한 것이며, 실제 코드 재현은 깃허브의 파일을 이용해야 합니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved