분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[public 0.6081829394] LSTM 코드 공유
처음 접근할 때 썼던 코드입니다.
라이프로그 12종 센서를 일 단위로 집계한 뒤, 최근 14일 시계열을 입력으로 사용하는 Multi-task BiLSTM으로 Q1~Q3, S1~S4 총 7개 타깃을 동시에 예측했습니다.
모델
BiLSTM 출력에 attention pooling, 마지막 시점 hidden state, static feature MLP, subject embedding을 결합해 멀티태스크 분류를 수행했습니다.
피처
센서별 daily 통계(mean/std/min/max/count) + 시간대별(아침/오후/저녁/심야) 집계
파생 변수: calendar feature, 결측치 개수, subject별 mean/std/z-score, lag1/2, diff, rolling mean
fold별로 안정적인 feature만 선별해 최대 256개 시계열 피처 사용
검증
subject별 날짜 순서를 유지한 time-aware 5-fold CV를 사용해 leakage를 줄였고, fold별 예측을 평균내어 최종 submission을 생성했습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved