Python 튜토리얼

Lv4 모델링 2/8 파이썬 python XGBoost 실습

2021.08.20 17:57 4,311 조회

안녕하세요🙋‍♀️🙋‍♂️ 이번시간에는 XGBoost를 이용해 와인 품질 분류를 진행해보도록  하겠습니다.


XGBoost의 경우 자주 사용했던 Scikit learn 라이브러리에서 기본적으로 제공하지 않습니다.


그래서 직접 XGBoost 라이브러리를 설치해 불러와야 합니다.


단, colab에는 기본적으로 설치 돼있으니, 기존 pandas와 같이 xgboost 라이브러리를 불러와서 사용하시면 됩니다.


---------------------------------------------------------------------------------------------------------------------------------------------------------------------

# 데이터 확인

train.head()


# 원핫 인코딩 (pd.get_dummies())

train_one = pd.get_dummies(train)

test_one = pd.get_dummies(test)


# 모델 정의

model = XGBClassifier()


# 모델 학습


# X 는 train에서 quality 를 제외한 모든 변수

# y 는 train의 qulity 변수


X = train_one.drop('quality',axis= 1)

y = train_one['quality']


# fit 메소드를 이용해 모델 학습

model.fit(X,y)


# predict 메소드와 test_one 데이터를 이용해 품질 예측

pred = model.predict(test_one)


# sample_submission.csv 파일을 불러와 예측된 값으로 채워 주기

submission = pd.read_csv('data/sample_submission.csv')

submission['quality'] = pred

submission.head()


# 정답파일 내보내기

submission.to_csv('xgb_pred.csv',index = False)

---------------------------------------------------------------------------------------------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #xgboost #부스팅 #앙상블

로그인이 필요합니다
0 / 1000
pyoh.amen
2021.08.23 23:54

👍

다욤
2021.09.20 01:51

done

Holte
2021.10.12 09:15

왼쪽눈썹왁싱
2021.11.01 20:11

페드로
2021.11.16 15:50

!

changhyeon
2021.12.30 16:52

done

moran
2022.01.03 17:04

dbnoid
2022.01.19 07:22

hijihyo
2022.01.27 13:51

호랭이띠
2022.01.31 22:42

acebed
2022.03.10 21:08

done

kimgugu
2022.03.28 13:44

Kdata
2022.05.03 14:28

krooner
2022.05.19 23:22

양현모든지쓸어버리겠다
2022.07.12 22:44

Y2J
2022.07.14 15:59

highllight
2023.02.12 22:38

김시옷
2023.05.28 16:19

done+
모델학습 오류