데이스쿨 심화 트랙2025: 웹 로그 기반 조회수 예측 해커톤

알고리즘 | 정형 | 회귀 | 웹 로그 | RMSE

  • moneyIcon 상금 : 인증서 + 데이스쿨
  • 2025.01.01 ~ 2025.05.24 23:59 + Google Calendar
  • 13명 마감

설명

Dataset Info.

  • train.csv [파일]
  • sessionID : 세션 ID
  • userID : 사용자 ID
  • TARGET : 세션에서 발생한 총 조회수
  • browser : 사용된 브라우저
  • OS : 사용된 기기의 운영체제
  • device : 사용된 기기
  • new : 첫 방문 여부 (0: 첫 방문 아님, 1: 첫 방문)
  • quality : 세션의 질 (거래 성사를 기준으로 측정된 값, 범위: 1~100)
  • duration : 총 세션 시간 (단위: 초)
  • bounced : 이탈 여부 (0: 이탈하지 않음, 1: 이탈함)
  • transaction : 세션 내에서 발생의 거래의 수
  • transaction_revenue : 총 거래 수익
  • continent : 세션이 발생한 대륙
  • subcontinent : 세션이 발생한 하위 대륙
  • country : 세션이 발생한 국가
  • traffic_source : 트래픽이 발생한 소스
  • traffic_medium : 트래픽 소스의 매체
  • keyword : 트래픽 소스의 키워드, 일반적으로 traffic_medium이 organic, cpc인 경우에 설정
  • referral_path : traffic_medium이 referral인 경우 설정되는 경로


  • test.csv [파일]
  • 한 세션에서 발생한 다양한 정보를 기록한 웹 로그
  • train.csv 파일과 거의 동일하나, TARGET이 존재하지 않음


  • sample_submission.csv [파일] - 제출 양식
  • sessionID : 세션 ID
  • TARGET : 예측 목표, test.csv의 TARGET을 예측하여 제출

상세