전력 수요량 예측 경진대회

알고리즘 | 정형 | 회귀 | 공공 | SMAPE

  • moneyIcon 상금 : 600만원
  • 859명 마감

 

이거 제가 잘못 이해하고 있는건가요? 데이터를 보면 각 아이템마다 피처로 볼 게 없습니다. 그저 미터id 뿐...

2019.10.01 15:14 4,160 조회

이거 제가 잘못 이해하고 있는건가요? 데이터를 보면 각 아이템마다 피처로 볼 게 없습니다. 그저 미터id 뿐인데요, 문제는 최종적으로 예측해야 하는 세대는 training에 없는 세대도 있습니다. 그죠? 근데 가령 submission의 맨처음에 나오는 X102나 X105의 경우에, 두 아이템이 각기 다른 예측값을 가져야하는 피처가 전혀 없기에 결국 이 두 예상값은 똑같을 수 밖에 없지 않습니까? X102, X105가 특정 아파트명이라는 는 데이터가 각기 다르기만해도 구분이 갈텐데, 주어진 데이터는 아무런 의미없는 미터id 밖에 없습니다. training에 없는 id에 대한 예측값이 달라질수 있습니까? 제가 뭔가 잘못이해하고 있는건가요?

 

baseline이 올라가있던데, 그 예측값에서 X102와 X105가 다른 결과값들을 가지고 있나요?

로그인이 필요합니다
0 / 1000
softgear
2022.02.14 16:20

안녕하세요. 주최기관인 ETRI의 softgear 입니다.

이 문제는 시계열(Time Series) 데이터 예측 문제 입니다.  이런 예측에서 가장 기본적인 feature 로는 과거값들이 사용됩니다. 즉 X102의 모든 행의 값들이 feature가 될 수 있습니다.  물론 최근 몇개만 예측에 입력으로 사용할 수도 있습니다. test셋에서 X102과 X105값이 다르므로 당연히 예측값들도 각각 다를 것입니다. 

추가로 예측하고자 하는 날짜의 기온, 날씨,  요일 등도 feature 로 활용할 수 있습니다. 

답이 되었나 모르겠네요. 

좋으 결과 있으시길 바랍니다.

 

송근구ㅡㄴ
2022.02.14 16:20

현재 주최 측인 ETRI에 문의 중입니다. 답변 회신 후 답변드리겠습니다!