학습 플랫폼 구독자 예측 AI 해커톤

알고리즘 | 정형 | 분류 | 웹 | Macro F1

  • moneyIcon 상금 : 인증서
  • 698명 마감

 

EDA_1일차_데이터 분포 파악하기(1)

2023.11.22 22:44 930 조회 language

전체적인 데이터의 분포를 확인해 보았다. 우선, 범주형 데이터와 수치형 데이터를 나눈 후 각 데이터에서 구독 유지 여부에 따른 분포를 확인해 보았다.

결측치가 없는 데이터라 다행이었고, 데이터 불균형이 있긴 하지만 데이터에 숨은 의미를 찾아낼 수 있게 더 고민해봐야 할 듯 싶다. 

시간이 부족해 대충 확인해 큰 차이가 없는걸로 확인했으나.. 더 고민하고 살펴보면 차이가 있으리라..

개인적으로 matplotlib 보다 Plotly가 이뻐서 사용한다..

코드
로그인이 필요합니다
0 / 1000
머일
2023.12.04 10:29

시각화 연습에 좋은 자료네요. 코드 공유 감사합니다 :)

YOUSEONG
2023.12.04 15:36

음... 데이터 분석을 처음 해보는데, 어떤 식으로 접근 해야할 지 몰랐는데, 배워갑니다.
Boxplot 으로 이상치가 탐지되었는데, 그대로 진행하신 이유가 있나요?