분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
안녕하세요, 데이터 설명을 읽어보니 "국내(인천지역) 특정 지역의 모 아파트 및 모 상가의 전력사용량."...
안녕하세요, 데이터 설명을 읽어보니
"국내(인천지역) 특정 지역의 모 아파트 및 모 상가의 전력사용량."
이라고 명시되 있는데 인천이 아닐까요?
또한
"train.csv와 포맷은 동일함. 그러나 예측해야 하는 세대의 아이디가 중복되지 않음"
이라고 나와있습니다.
이러한 점에서 미루어 볼때 train.csv에서 추출한 피처를 통해 학습 모델을 생성하고,
이를 기반으로 test.csv 정보를 기반으로 submission.csv(시계열 상으로 test.csv 이후)를 예측하는 것이 아닌가 싶습니다.(test.csv와 submission.csv의 세대(상가)는 같습니다.)
혹시라도 제가 잘못 생각하고 있는 부분이 있다면 의견 주시면 감사하겠습니다! 이번 문제는 고려해야될게 많은거 같아서 복잡하네요 ㅜ
제대로 이해 하셨습니다. 인천 지역 맞습니다.
train 셋, test 셋 모두 잘 활용하시기 바랍니다.
예를들면(성능이 어떻게 될지는 모르지만) test셋을 쪼개서 예측 모델을 학습하는 용도로도 사용할수도 있습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
아 docx파일을 제가 못봤었네요. 감사합니다