제 5회 ETRI 휴먼이해 인공지능 논문경진대회

알고리즘 | 정형 | 라이프로그 | 논문 | 분류 | Log Loss

  • moneyIcon 상금 530만 원
  • 758명 종료까지 D-24

 

[public 0.6081829394] LSTM 코드 공유

2026.04.27 17:33 1,067 조회 language

처음 접근할 때 썼던 코드입니다.
라이프로그 12종 센서를 일 단위로 집계한 뒤, 최근 14일 시계열을 입력으로 사용하는 Multi-task BiLSTM으로 Q1~Q3, S1~S4 총 7개 타깃을 동시에 예측했습니다.

모델
BiLSTM 출력에 attention pooling, 마지막 시점 hidden state, static feature MLP, subject embedding을 결합해 멀티태스크 분류를 수행했습니다.

피처
센서별 daily 통계(mean/std/min/max/count) + 시간대별(아침/오후/저녁/심야) 집계
파생 변수: calendar feature, 결측치 개수, subject별 mean/std/z-score, lag1/2, diff, rolling mean
fold별로 안정적인 feature만 선별해 최대 256개 시계열 피처 사용

검증
subject별 날짜 순서를 유지한 time-aware 5-fold CV를 사용해 leakage를 줄였고, fold별 예측을 평균내어 최종 submission을 생성했습니다.

코드