📣 오늘의 파이썬 🐣

2021.08.20 14:41 2,903 Views

데이터 분석


   👩🏻‍💻 탐색적 데이터 분석(EDA)


          데이터 탐색 기초

                 - 라이브러리 불러오기 (import)

                 - 파일 불러오기 (read_csv())

                 - 행열갯수 관찰하기 (shape)

                 - 데이터 확인하기 (head())

                 - 결측치 유무 확인하기 isnull().sum()

                 - 데이터 결측치 확인하기 (info())

                 - 수치데이터 특성 보기 (describe())  

        

          시각화

                 - Matplotlib 선 그래프 (plot())

                 - Matplotlib 히스토그램 (hist())

                 - Seaborn 히스토그램 (distplot())

                 - Seaborn 산점도 그래프 (scatterplot())

                 - Seaborn 산점도 그래프 (pairplot())

                 - Seaborn  HeatMap 그래프(heatmap())


   👷 정형 데이터 전처리


          결측치 다루기

                 - 결측치 삭제하기, 대체하기 (dropna(), fillna())

                 - 결측치 평균으로 대체 (fillna({mean}))

                 - 결측치 보간법으로 대체 (interpolate())


          이상치 다루기

                 - 이상치 탐지 seaborn_boxplot()

                 - 이상치 제거 IQR


          정규화 및 인코딩

                 - 수치형 데이터 정규화 MinMaxScaler()

                 - 원-핫 인코딩 OneHotEncoder()


          다중공선성

                 - 다중공선성 해결 - 변수 정규화

                 - 다중공선성 해결 - 변수 제거

                 - 다중공선성 해결 - PCA (1)

                 - 다중공선성 해결 - PCA (2)

                 - 다중공선성 해결 - PCA (3)


          파생 변수 추가

                 - 연속형 변수 변환 (1)

                 - 연속형 변수 변환 (2)

                 - Polynomial Features (1)

                 - Polynomial Features (2)


🤖 머신러닝


   ✨모델


          의사결정나무(Decision Tree)

                 - 모델개념 (Decision Tree)

                 - 모델선언 (DecisionTreeClassifier())

                 - 모델훈련 (fit())

                 - 테스트예측(predict())


          Random forest

                 - 모델 정의 RandomForestClassifier()

                 - 랜덤포레스트 변수중요도 확인 (feature_importances_)

                 - 모델 실습


          교차 검증

                 - 교차 검증 정의 K-Fold

                 - 교차검증 실습 K-Fold


   🎛 튜닝


          Grid Search

                 - 하이퍼파라미터, GridSearch 개념 (정지규칙)

                 - GridSearch 구현 (GridSearchCV())


          Bayesain optimization

                 - Bayesian Optimization

                 - 그리드, 랜덤 서치 vs Bayesian Optimization

                 - Bayesian Optimization 실습