분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
EDA_1일차_데이터 분포 파악하기(1)
전체적인 데이터의 분포를 확인해 보았다. 우선, 범주형 데이터와 수치형 데이터를 나눈 후 각 데이터에서 구독 유지 여부에 따른 분포를 확인해 보았다.
결측치가 없는 데이터라 다행이었고, 데이터 불균형이 있긴 하지만 데이터에 숨은 의미를 찾아낼 수 있게 더 고민해봐야 할 듯 싶다.
시간이 부족해 대충 확인해 큰 차이가 없는걸로 확인했으나.. 더 고민하고 살펴보면 차이가 있으리라..
개인적으로 matplotlib 보다 Plotly가 이뻐서 사용한다..
음... 데이터 분석을 처음 해보는데, 어떤 식으로 접근 해야할 지 몰랐는데, 배워갑니다.
Boxplot 으로 이상치가 탐지되었는데, 그대로 진행하신 이유가 있나요?
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
시각화 연습에 좋은 자료네요. 코드 공유 감사합니다 :)