Python 튜토리얼

정형 데이터 분석 파이프라인 - (2)

2021.09.08 09:29 3,190 조회

안녕하세요 여러분 ! 지난 시간에는 정형 데이터 분석 파이프라인 중  EDA와 데이터 전처리에 대해 알아 보았습니다.

이번 시간에는 머신러닝 모델링과 모델 튜닝에 대해 알아보도록 하겠습니다. 👱‍♀️👱‍♂️

그럼 바로 시작해보겠습니다.🏃‍♀️🏃‍♂️



3️⃣ 머신러닝 모델링


머신러닝 모델링 과정은 모델을 정의하고 학습데이터로 모델을 학습(훈련) 시키는 과정입니다.

오늘의 파이썬에서는 트리 기반의 Decision Tree, 여러 모델을 결합한 앙상블 모델인 Random Forest, Xgboost, Light GBM ,Voting Classifier 등을 알아보았습니다.

또한 모델을 검증 하는 방법으로 K-fold 와 K-fold의 문제점인 target 데이터의 비율을 일정하게 유지 하지 못하는 것을 일정 하게 유지하며, 교차 검증을 진행 하는 Strtified K-Fold에 대해 배웠습니다.


오늘의 파이썬에서 모델링 내용은 아래 링크에서 확인 하실 수 있습니다. 🤴👸


모델


모델 검증


4️⃣ 모델 튜닝


모델을 학습 한다고해서 그 모델이 해당 데이터에 맞는 최적의 모델이 아닙니다.

모델에 존재하는 여러가지 파라미터(ex. 트리의 깊이, 학습률)의 최적값을 찾는 과정인 모델 튜닝 과정을 통해 데이터에 맞는 최적의 모델을 구할 수 있습니다.

모델을 튜닝 하는 방법은 여러가지가 있지만 오늘의 파이썬 컨텐츠 중에는  GridSearch, Basian optimization 등이 있습니다.


GridSearch



Basian optimization




↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv



로그인이 필요합니다
0 / 1000
다욤
2021.09.20 02:31

done

Holte
2021.10.12 09:19

왼쪽눈썹왁싱
2021.11.02 15:58

changhyeon
2022.01.03 18:05

done

dbnoid
2022.01.19 11:10

hijihyo
2022.01.29 19:41

kimgugu
2022.03.30 11:05

krooner
2022.05.20 00:21

highllight
2023.02.12 22:36