서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
메타데이터활용
total_data = pd.merge(train_data, brand_data, on = '브랜드')
이렇게 메타데이터를 활용해서 사용했는데 아래와 같이 total_data가 나왔습니다.
이걸 모델링에 그냥 사용하게 되면 너무 많은 시간이 걸리는데 이게 메타데이터를 활용했을 때 이렇게 데이터가 합쳐지는게 맞나요??ㅠ
train과 valid 데이터를 나눌 때 x, y 따로 나눠야 되는건가요???
day_x의 왼쪽 끝과 day_y의 왼쪽 끝을 같이 잡아서 넣어가도록 total 데이터를 생성하려면 어떻게 구성해야 되는지 여쭤봐도 될까요??ㅠ 찾아보고 시도해봐도 잘 안되서요ㅠㅠㅠ
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
모델에 어떻게 데이터를 넣어주시는지는 모르겠지만,
baseline 코드 기준으로 기존에 왼쪽부터 순차적으로 윈도우를 만들어서 읽어나가는 방식을 사용하신다면,
day_x의 왼쪽 끝과 day_y의 왼쪽 끝을 같이 잡아서 넣어나가도록 하셔야 할 것 같습니다!
또는 컬럼 순서를 day1_x, day1_y, day2_x, day2_y, .... ,dayN_x, dayN_y 이런식으로 바꿔서 두 칸씩 슬라이드를 읽어나가도록 하면 데이터 로드하기는 쉬울 것 같기도 하네요...
기존 코드 그대로 간다면 day_y가 타겟값으로 잡혀서 예측이 이상하게 될 것 같네요