[1주년 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
EDA_1일차_데이터 분포 파악하기(1)
전체적인 데이터의 분포를 확인해 보았다. 우선, 범주형 데이터와 수치형 데이터를 나눈 후 각 데이터에서 구독 유지 여부에 따른 분포를 확인해 보았다.
결측치가 없는 데이터라 다행이었고, 데이터 불균형이 있긴 하지만 데이터에 숨은 의미를 찾아낼 수 있게 더 고민해봐야 할 듯 싶다.
시간이 부족해 대충 확인해 큰 차이가 없는걸로 확인했으나.. 더 고민하고 살펴보면 차이가 있으리라..
개인적으로 matplotlib 보다 Plotly가 이뻐서 사용한다..
음... 데이터 분석을 처음 해보는데, 어떤 식으로 접근 해야할 지 몰랐는데, 배워갑니다.
Boxplot 으로 이상치가 탐지되었는데, 그대로 진행하신 이유가 있나요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
시각화 연습에 좋은 자료네요. 코드 공유 감사합니다 :)