[스터디 5기 정규반 1조 첫째주 금요일] 숙제인증

2024.02.16 23:04 534 조회

정말 간단하게 따로 plot들만 만든 후, 디자인 수정 없이 진행했습니다. 이후 주말 숙제에 진행할 예정입니다.


이번 대회의 데이터는 3가지 종류로 나눌 수 있습니다.


Categorical variables: browser, OS, device, continent, subcontinent, country, traffic_source, traffic_medium

Continuous variables: TARGET, quality, duration, transaction, transaction_revenue

Binary variables: new, bounced


(sessionID, userID는 개별적이므로 따로 EDA를 진행하지 않았으며, keyword와 referral_path는 결측값이 많아 제외했습니다.)


결측값 카운팅


Simple EDA

  • Categorical variables
  • browser
  • OS
  • device
  • continent
  • subcontinent
  • country
  • traffic_source
  • traffic_medium


  • Continuous variables
  • TARGET
  • quality
  • duration
  • transaction & transaction_revenue


  • Binary variables
  • new
  • bounced

데이터 타입들을 나눈 후, 이렇게 간단히 plot들을 만들어 간단한 탐색적 데이터 분석을 진행하였습니다.