분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[public 0.6081829394] LSTM 코드 공유
처음 접근할 때 썼던 코드입니다.
라이프로그 12종 센서를 일 단위로 집계한 뒤, 최근 14일 시계열을 입력으로 사용하는 Multi-task BiLSTM으로 Q1~Q3, S1~S4 총 7개 타깃을 동시에 예측했습니다.
모델
BiLSTM 출력에 attention pooling, 마지막 시점 hidden state, static feature MLP, subject embedding을 결합해 멀티태스크 분류를 수행했습니다.
피처
센서별 daily 통계(mean/std/min/max/count) + 시간대별(아침/오후/저녁/심야) 집계
파생 변수: calendar feature, 결측치 개수, subject별 mean/std/z-score, lag1/2, diff, rolling mean
fold별로 안정적인 feature만 선별해 최대 256개 시계열 피처 사용
검증
subject별 날짜 순서를 유지한 time-aware 5-fold CV를 사용해 leakage를 줄였고, fold별 예측을 평균내어 최종 submission을 생성했습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved