분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
스마트 창고 출고 지연 예측 | Mega33 앙상블 + Sequential Oracle
OOF MAE 8.3825 / Public LB 9.7527 / Private 10.01261 / 17등
Mega33 앙상블
LGB(MAE·Huber)·XGB·CatBoost를 v23/v24/v26/domain_aug/offset/neural_army 6개 피처 버전 × 다중 시드로 총 33개 Base 모델 학습. GroupKFold(layout_id, n=5)로 unseen layout이 val fold에 자연 포함되도록 설계. OOF를 Level-2 Meta(LGB·XGB·CB)로 스태킹.
피처(v31, 335개)
lag·lead·rolling·SC 시나리오 집계·상호작용 조합.
FIXED base
Mega33 + Ranking 보정(rank_adj) + Pseudo-Labeling 3라운드를 고정 가중치로 블렌드.
FIXED = mega33×0.7637 + rank_adj×0.1589 + pseudo×0.0775
Sequential Oracle
FIXED OOF를 proxy lag으로 활용해 oracle_xgb·oracle_lv2·oracle_remaining 3종 재학습.
oracle_NEW = FIXED×0.64 + oracle_xgb×0.12 + oracle_lv2×0.16 + oracle_rem×0.08
250개 이상 실험에서 Gate 분기·Scipy 최적화·Temporal CV·unseen 보정 등 OOF 개선에도 LB 악화 일관 확인. GroupKFold(layout_id)가 결국 최선이었습니다.
제 최대 병목은 unseen layout(test 절반) 분포 시프트였는데, 모든 실험에서 unseen 올리는 시도는 LB가 악화되었습니다.
다른 분들은 어떻게 접근하셨는지 궁금합니다. 다들 고생하셨습니다!
github: https://github.com/tkddnjs-dlqslek/dacon-warehouse-delay-prediction.git
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved