분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
이거 제가 잘못 이해하고 있는건가요? 데이터를 보면 각 아이템마다 피처로 볼 게 없습니다. 그저 미터id 뿐...
이거 제가 잘못 이해하고 있는건가요? 데이터를 보면 각 아이템마다 피처로 볼 게 없습니다. 그저 미터id 뿐인데요, 문제는 최종적으로 예측해야 하는 세대는 training에 없는 세대도 있습니다. 그죠? 근데 가령 submission의 맨처음에 나오는 X102나 X105의 경우에, 두 아이템이 각기 다른 예측값을 가져야하는 피처가 전혀 없기에 결국 이 두 예상값은 똑같을 수 밖에 없지 않습니까? X102, X105가 특정 아파트명이라는 는 데이터가 각기 다르기만해도 구분이 갈텐데, 주어진 데이터는 아무런 의미없는 미터id 밖에 없습니다. training에 없는 id에 대한 예측값이 달라질수 있습니까? 제가 뭔가 잘못이해하고 있는건가요?
baseline이 올라가있던데, 그 예측값에서 X102와 X105가 다른 결과값들을 가지고 있나요?
현재 주최 측인 ETRI에 문의 중입니다. 답변 회신 후 답변드리겠습니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. 주최기관인 ETRI의 softgear 입니다.
이 문제는 시계열(Time Series) 데이터 예측 문제 입니다. 이런 예측에서 가장 기본적인 feature 로는 과거값들이 사용됩니다. 즉 X102의 모든 행의 값들이 feature가 될 수 있습니다. 물론 최근 몇개만 예측에 입력으로 사용할 수도 있습니다. test셋에서 X102과 X105값이 다르므로 당연히 예측값들도 각각 다를 것입니다.
추가로 예측하고자 하는 날짜의 기온, 날씨, 요일 등도 feature 로 활용할 수 있습니다.
답이 되었나 모르겠네요.
좋으 결과 있으시길 바랍니다.