2023 전력사용량 예측 AI 경진대회

시계열 데이터 처리 질문이 있습니다.

2023.08.02 16:05 1,775 조회

안녕하세요.

이번 대회를 진행하면서 시계열 데이터를 처음 다뤄보는 데 궁금증이 몇 개 생겼습니다.

LSTM baseline의 경우 예측하고자 하는 전력 소모량의 이전 날짜들을 사용함으로써 (ex: 13일의 전력량 예측을 위해서, 1~12일의 변수를 사용) 시계열 처리란

이런거구나 하고 생각했는데, Random Forest baseline을 보니 일반적인 regression으로 예측을 하더라구요. (ex: 13일의 전력량 예측을 위해서 13일의 변수를 사용)

  1. 시계열 데이터를 다룰 때 보통 둘 다 많이 접근하는 방향인가요?? 아니면 Random Forest같은 경우에는 시계열이라고 보기 어려운건가요??
  2. 추세, 계절성, 순환, 잔차 등 시계열 분해의 경우 regression model을 위해서만 사용되나요?? RNN과 같은 딥러닝의 경우 시계열 분해는 필요가 없나요??
로그인이 필요합니다
0 / 1000
쿠마리코지카후원회동남지부장
2023.08.03 13:26

https://doi.org/10.1016/j.ijforecast.2020.07.007
위 글을 보니 예전 Kaggle 시계열 예측 대회에서 어떤 방법이 사용되었는지 정리되어 있네요.
트리 기반 방법, 신경망, 통계적 방법 모두 시도되는 것 같습니다.

제출수늘려주세요
2023.08.03 13:39

잘나오는놈이 답입니다~