분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv4 모델링 2/8 파이썬 python XGBoost 실습
안녕하세요🙋♀️🙋♂️ 이번시간에는 XGBoost를 이용해 와인 품질 분류를 진행해보도록 하겠습니다.
XGBoost의 경우 자주 사용했던 Scikit learn 라이브러리에서 기본적으로 제공하지 않습니다.
그래서 직접 XGBoost 라이브러리를 설치해 불러와야 합니다.
단, colab에는 기본적으로 설치 돼있으니, 기존 pandas와 같이 xgboost 라이브러리를 불러와서 사용하시면 됩니다.
---------------------------------------------------------------------------------------------------------------------------------------------------------------------
# 데이터 확인
train.head()
# 원핫 인코딩 (pd.get_dummies())
train_one = pd.get_dummies(train)
test_one = pd.get_dummies(test)
# 모델 정의
model = XGBClassifier()
# 모델 학습
# X 는 train에서 quality 를 제외한 모든 변수
# y 는 train의 qulity 변수
X = train_one.drop('quality',axis= 1)
y = train_one['quality']
# fit 메소드를 이용해 모델 학습
model.fit(X,y)
# predict 메소드와 test_one 데이터를 이용해 품질 예측
pred = model.predict(test_one)
# sample_submission.csv 파일을 불러와 예측된 값으로 채워 주기
submission = pd.read_csv('data/sample_submission.csv')
submission['quality'] = pred
submission.head()
# 정답파일 내보내기
submission.to_csv('xgb_pred.csv',index = False)
---------------------------------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #xgboost #부스팅 #앙상블
done
✅
✅
!
done
✅
✅
✅
✅
done
✅
✅
✅
✅
✅
✅
done+
모델학습 오류
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
👍