정형 데이터 분석 파이프라인 - (2)

Python 튜토리얼

DACON.edu

2021.09.08 09:29 5,368 조회

안녕하세요 여러분 ! 지난 시간에는 정형 데이터 분석 파이프라인 중 EDA와 데이터 전처리에 대해 알아 보았습니다.

이번 시간에는 머신러닝 모델링과 모델 튜닝에 대해 알아보도록 하겠습니다. 👱‍♀️👱‍♂️

그럼 바로 시작해보겠습니다.🏃‍♀️🏃‍♂️

3️⃣ 머신러닝 모델링

머신러닝 모델링 과정은 모델을 정의하고 학습데이터로 모델을 학습(훈련) 시키는 과정입니다.

오늘의 파이썬에서는 트리 기반의 Decision Tree, 여러 모델을 결합한 앙상블 모델인 Random Forest, Xgboost, Light GBM ,Voting Classifier 등을 알아보았습니다.

또한 모델을 검증 하는 방법으로 K-fold 와 K-fold의 문제점인 target 데이터의 비율을 일정하게 유지 하지 못하는 것을 일정 하게 유지하며, 교차 검증을 진행 하는 Strtified K-Fold에 대해 배웠습니다.

오늘의 파이썬에서 모델링 내용은 아래 링크에서 확인 하실 수 있습니다. 🤴👸

모델

모델 검증

4️⃣ 모델 튜닝

모델을 학습 한다고해서 그 모델이 해당 데이터에 맞는 최적의 모델이 아닙니다.

모델에 존재하는 여러가지 파라미터(ex. 트리의 깊이, 학습률)의 최적값을 찾는 과정인 모델 튜닝 과정을 통해 데이터에 맞는 최적의 모델을 구할 수 있습니다.

모델을 튜닝 하는 방법은 여러가지가 있지만 오늘의 파이썬 컨텐츠 중에는 GridSearch, Basian optimization 등이 있습니다.

GridSearch

Basian optimization

↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv

댓글 9개

로그인이 필요합니다

comment

0 / 1000

다욤

2021.09.20 02:31

done

Holte

2021.10.12 09:19

✅

왼쪽눈썹왁싱

2021.11.02 15:58

✅

changhyeon

2022.01.03 18:05

done

dbnoid

2022.01.19 11:10

✅

hijihyo

2022.01.29 19:41

✅

kimgugu

2022.03.30 11:05

✅

krooner

2022.05.20 00:21

✅

highllight

2023.02.12 22:36

✅

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동했습니다!

현재 글

정형 데이터 분석 파이프라인 - (2)

대회 - Python 튜토리얼

5년 전