Python 튜토리얼

기초

  • moneyIcon Prize : 교육
  • 9,999명 D-100698

 

Lv4 모델링 6/8 파이썬 python stratified k-fold 실습

2021.08.26 11:21 2,536 Views

안녕하세요. 😎😎 지난 시간에는 Stratified k-fold의 개념에 대해 배웠습니다.

Stratified k-fold 란, k-fold의 문제점인 target 데이터의 비율을 일정 하게 유지하며, 교차 검증을 진행 하는 것 입니다.


이번 시간에는 stratified k-fold 와 Light GBM을 이용해 와인 품질 분류를 실습 해보도록 하겠습니다.

----------------------------------------------------------------------------------------------------------------------------

# StratifiedKFold라이브러리를 이용해 5개의 fold로 나눔.


skf = StratifiedKFold(n_splits = 5)


X = train_one.drop('quality',axis = 1)

y = train_one['quality']

cnt = 1

acc = 0

for train_idx, valid_idx in skf.split(X,y):

  

  train_data = train_one.iloc[train_idx]

  valid_data = train_one.iloc[valid_idx]


  # 모델 정의

  model = LGBMClassifier()


  # train_X 는 train_data에서 quality 를 제외한 모든 변수

  # train_y 는 train_data의 qulity 변수


  train_X = train_data.drop('quality',axis= 1)

  train_y = train_data['quality']


  # fit 메소드를 이용해 모델 학습

  model.fit(train_X,train_y)



  valid_X = valid_data.drop('quality',axis = 1)

  valid_y = valid_data['quality']


  # predict 메소드와 valid_X 데이터를 이용해 품질 예측

  pred = model.predict(valid_X)


  # 모델 정확도 출력

  print(cnt," 번째 모델 정확도 : " ,accuracy_score(pred,valid_y))

  acc += accuracy_score(pred,valid_y)

  cnt+=1


print('모델 정확도 평균 : ',acc/5)

----------------------------------------------------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트

#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선  #데이터분석 #데이터사이언티스트 #코랩 #Python  #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #stratified kfold #교차검증 #LGBM


로그인이 필요합니다
0 / 1000
그린티
2021.09.12 20:49

done

다욤
2021.09.20 02:00

done

Holte
2021.10.12 09:22

왼쪽눈썹왁싱
2021.11.01 20:38

changhyeon
2021.12.30 17:41

done

moran
2022.01.03 17:19

dbnoid
2022.01.19 09:24

hijihyo
2022.01.27 14:17

호랭이띠
2022.01.31 23:22

acebed
2022.03.10 21:08

done

kimgugu
2022.03.28 13:54

Kdata
2022.05.03 14:50

krooner
2022.05.19 23:40

dirno
2022.07.14 16:28

Choijyun
2022.08.01 14:35

done

highllight
2023.02.12 22:39

김시옷
2023.05.28 16:41

done+

이전 글
인덱싱을 위한 Pandas .iloc .loc 사용 방법 데이터 분석 및 조작을위한
Competition - Python 튜토리얼
Likes 4
Views 1,825
Comments 0
일 년 전
현재 글
Lv4 모델링 6/8 파이썬 python stratified k-fold 실습
Competition - Python 튜토리얼
Likes 8
Views 2,536
Comments 17
3년 전
다음 글
다음 글이 존재하지 않습니다.