온라인 채널 제품 판매량 예측 AI 온라인 해커톤

채용 | 알고리즘 | 정형 | 시계열 | LG Aimers | 수요 예측 | SFA

  • moneyIcon 상금 : 본선 진출
  • 1,783명 마감

설명

Dataset Info.

  • train.csv [파일]
  • ID : 실제 판매되고 있는 고유 ID
  • 제품 : 제품 코드
  • 대분류 : 제품의 대분류 코드
  • 중분류 : 제품의 중분류 코드
  • 소분류 : 제품의 소분류 코드
  • 브랜드 : 제품의 브랜드 코드
  • 2022-01-01 ~ 2023-04-04 : 실제 일별 판매량
  • 단, 제품이 동일하여도 판매되고 있는 고유 ID 별로 기재한 분류 정보가 상이할 수 있음
  • 즉 고유 ID가 다르다면, 제품이 같더라도 다른 판매 채널


  • sample_submission.csv [파일] - 제출 양식
  • ID : 실제 판매되고 있는 고유 ID

※ 제출 시 ID Column에 해당하는 데이터에 반드시 zfill(5)를 적용할 필요 없음

  • 2023-04-05 ~ 2023-04-25 : 예측한 일별 판매량


  • sales.csv [파일] - 메타(Meta) 정보
  • ID : 실제 판매되고 있는 고유 ID
  • 제품 : 제품 코드
  • 대분류 : 제품의 대분류 코드
  • 중분류 : 제품의 중분류 코드
  • 소분류 : 제품의 소분류 코드
  • 브랜드 : 제품의 브랜드 코드
  • 2022-01-01 ~ 2023-04-04 : 실제 일별 총 판매금액
  • 단, 제품이 동일하여도 판매되고 있는 고유 ID 별로 기재한 분류 정보가 상이할 수 있음
  • 즉 고유 ID가 다르다면, 제품이 같더라도 다른 판매 채널


  • brand_keyword_cnt.csv [파일] - 메타(Meta) 정보
  • 브랜드 : 브랜드 코드
  • 2022-01-01 ~ 2023-04-04 : 브랜드의 연관키워드 언급량을 정규화한 일별 데이터


  • product_info.csv [파일] - 메타(Meta) 정보
  • 제품 : 제품 코드
  • 제품특성 : 제품 특성 데이터(Text)
  • train.csv에 존재하는 모든 제품 코드가 포함되어 있지 않음. 또는 product_info.csv에 존재하는 제품 코드가 train.csv에 존재하지 않을 수 있음



※ 제공드리는 데이터를 엑셀로 열람하는 경우, 데이터가 비정상적으로 보이는 현상이 발생할 수 있으니 반드시 Pandas패키지와 같은 데이터툴을 이용하여 열람부탁드립니다.

상세