분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
정형 데이터 분석 파이프 라인 (1)
안녕하세요 여러분 ! 👩🏫👨🏫 약 3달간 진행 되었던 오늘의 파이썬이 Lv1 부터 Lv4 까지 모두 공개 되었습니다.
처음 부터 끝까지 꾸준하게 따라오신 여러분 너무 고생 많으셨습니다.🏃♀️🏃♂️
이제까지 학습했던 내용을 되돌아 볼 겸, 이번 시간과 다음 시간에는 정형 데이터 분석의 전체 파이프라인에 대해 복습해 보도록 하겠습니다.
순서는 다음과 같습니다. 그럼 바로 시작해보겠습니다.
EDA : 처음 데이터를 수집하였을 때 다양한 각도에서 관찰하고 이해하는 과정.
EDA 과정이 필요한 이유는 데이터 분석을 시작 하기전에 데이터에대한 100% 이해가 필요하기 때문입니다. 데이터를 잘 이해하고 파악하여야 목적에 맞게 데이터를 정제 시킬 수 있고 더 나아가 새로운 인사이트를 도출 할 수 있게 될 것 입니다 ! 👨🏫
오늘의 파이썬에서 EDA 기초 내용은 아래 링크에서 확인 하실 수 있습니다. 🤴👸
데이터 전처리 과정은 데이터 분석의 전체 파이프라인에서 가장 중요한 과정입니다.👨🦳
분석 결과/인사이트와 모델 성능에 직접적인 영향을 미치는 과정이기 때문에 중요하게 다뤄지는 과정입니다.
한 설문조사에 의하면, 분석가의 80% 시간을 데이터 수집 및 전처리에 사용한다고 합니다.🕵️♂️
오늘의 파이썬에서 데이터 전처리 기초 내용은 아래 링크에서 확인 하실 수 있습니다.🦸♀️🦸♂️
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv
✅
✅
done
✅
✅
done
✅
✅
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
done