온라인 채널 제품 판매량 예측 AI 온라인 해커톤

메타데이터활용

2023.08.25 10:08 1,277 Views

total_data = pd.merge(train_data, brand_data, on = '브랜드')

이렇게 메타데이터를 활용해서 사용했는데 아래와 같이 total_data가 나왔습니다.

이걸 모델링에 그냥 사용하게 되면 너무 많은 시간이 걸리는데 이게 메타데이터를 활용했을 때 이렇게 데이터가 합쳐지는게 맞나요??ㅠ

train과 valid 데이터를 나눌 때 x, y 따로 나눠야 되는건가요???


로그인이 필요합니다
0 / 1000
이세의인공지능
2023.08.25 10:26

모델에 어떻게 데이터를 넣어주시는지는 모르겠지만, 
baseline 코드 기준으로 기존에 왼쪽부터 순차적으로 윈도우를 만들어서 읽어나가는 방식을 사용하신다면,
day_x의 왼쪽 끝과 day_y의 왼쪽 끝을 같이 잡아서 넣어나가도록 하셔야 할 것 같습니다!
또는 컬럼 순서를 day1_x, day1_y, day2_x, day2_y, .... ,dayN_x, dayN_y 이런식으로 바꿔서 두 칸씩 슬라이드를 읽어나가도록 하면 데이터 로드하기는 쉬울 것 같기도 하네요...
기존 코드 그대로 간다면 day_y가 타겟값으로 잡혀서 예측이 이상하게 될 것 같네요

iiioo24
2023.08.25 11:30

day_x의 왼쪽 끝과 day_y의 왼쪽 끝을 같이 잡아서 넣어가도록 total 데이터를 생성하려면 어떻게 구성해야 되는지 여쭤봐도 될까요??ㅠ 찾아보고 시도해봐도 잘 안되서요ㅠㅠㅠ