분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
대표적으로, 현재 제공되는 test데이터의 컬럼명은 train과 겹치지 않는데, 분석 코드에서는 481번까지 사용하는 예시가 있네요..
안녕하세요 이삭님 기존의 테스트 데이터는 0~1500세대를 랜덤 샘플링하여 200개를 추출하였습니다. 그래서 세대명이 X481인 세대가 존재하고 있습니다.
train과 test의 중복은 없습니다. 현재 제공된 데이터는 조금 더 가공되어 NX0~1300 세대까지 Train, N1301~1500까지 Test 데이터로 구성되어 있습니다.
감사합니다.
넵 확인 감사합니다.!
업로드된 dataset을 사용하면, 3장 탐색적 자료분석의 그래프가 재현되지 않습니다.
train은 meter id 1~1300까지이고, test는 meter id 1301~1500인데,
설명에 있는 그래프는 train과 test가 나뉘지 않고 혼재되어 잘못된 그래프로 보입니다.
코드상의 meter id처리도 'NX' 대신 'X'만을 처리하고,
코드상의 '# Predict 2018.7.2 ~ 2018.11.30'부분의 loop에서 에러도 발생합니다.
dataset 또는 코드가 완전하지 않은것 같습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
지금 올라와 있는 데이터와 맞지 않는 부분이 있는데, 대회 초기와 현재 데이터가 달라진 부분이 있을까요?