분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
정형 데이터 분석 파이프라인 - (2)
안녕하세요 여러분 ! 지난 시간에는 정형 데이터 분석 파이프라인 중 EDA와 데이터 전처리에 대해 알아 보았습니다.
이번 시간에는 머신러닝 모델링과 모델 튜닝에 대해 알아보도록 하겠습니다. 👱♀️👱♂️
그럼 바로 시작해보겠습니다.🏃♀️🏃♂️
머신러닝 모델링 과정은 모델을 정의하고 학습데이터로 모델을 학습(훈련) 시키는 과정입니다.
오늘의 파이썬에서는 트리 기반의 Decision Tree, 여러 모델을 결합한 앙상블 모델인 Random Forest, Xgboost, Light GBM ,Voting Classifier 등을 알아보았습니다.
또한 모델을 검증 하는 방법으로 K-fold 와 K-fold의 문제점인 target 데이터의 비율을 일정하게 유지 하지 못하는 것을 일정 하게 유지하며, 교차 검증을 진행 하는 Strtified K-Fold에 대해 배웠습니다.
오늘의 파이썬에서 모델링 내용은 아래 링크에서 확인 하실 수 있습니다. 🤴👸
모델을 학습 한다고해서 그 모델이 해당 데이터에 맞는 최적의 모델이 아닙니다.
모델에 존재하는 여러가지 파라미터(ex. 트리의 깊이, 학습률)의 최적값을 찾는 과정인 모델 튜닝 과정을 통해 데이터에 맞는 최적의 모델을 구할 수 있습니다.
모델을 튜닝 하는 방법은 여러가지가 있지만 오늘의 파이썬 컨텐츠 중에는 GridSearch, Basian optimization 등이 있습니다.
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv
✅
✅
done
✅
✅
✅
✅
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
done