온라인 채널 제품 판매량 예측 AI 온라인 해커톤

채용 | 알고리즘 | 정형 | 시계열 | LG Aimers | 수요 예측 | SFA

본선 진출
1,909명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

메타데이터활용

iiioo24

2023.08.25 10:08 3,719 조회

total_data = pd.merge(train_data, brand_data, on = '브랜드')

이렇게 메타데이터를 활용해서 사용했는데 아래와 같이 total_data가 나왔습니다.

이걸 모델링에 그냥 사용하게 되면 너무 많은 시간이 걸리는데 이게 메타데이터를 활용했을 때 이렇게 데이터가 합쳐지는게 맞나요??ㅠ

train과 valid 데이터를 나눌 때 x, y 따로 나눠야 되는건가요???

댓글 2개

로그인이 필요합니다

comment

0 / 1000

이세의인공지능

2023.08.25 10:26

모델에 어떻게 데이터를 넣어주시는지는 모르겠지만,
baseline 코드 기준으로 기존에 왼쪽부터 순차적으로 윈도우를 만들어서 읽어나가는 방식을 사용하신다면,
day_x의 왼쪽 끝과 day_y의 왼쪽 끝을 같이 잡아서 넣어나가도록 하셔야 할 것 같습니다!
또는 컬럼 순서를 day1_x, day1_y, day2_x, day2_y, .... ,dayN_x, dayN_y 이런식으로 바꿔서 두 칸씩 슬라이드를 읽어나가도록 하면 데이터 로드하기는 쉬울 것 같기도 하네요...
기존 코드 그대로 간다면 day_y가 타겟값으로 잡혀서 예측이 이상하게 될 것 같네요

iiioo24

2023.08.25 11:30

day_x의 왼쪽 끝과 day_y의 왼쪽 끝을 같이 잡아서 넣어가도록 total 데이터를 생성하려면 어떻게 구성해야 되는지 여쭤봐도 될까요??ㅠ 찾아보고 시도해봐도 잘 안되서요ㅠㅠㅠ

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동했습니다!