분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv4 모델링 6/8 파이썬 python stratified k-fold 실습
안녕하세요. 😎😎 지난 시간에는 Stratified k-fold의 개념에 대해 배웠습니다.
Stratified k-fold 란, k-fold의 문제점인 target 데이터의 비율을 일정 하게 유지하며, 교차 검증을 진행 하는 것 입니다.
이번 시간에는 stratified k-fold 와 Light GBM을 이용해 와인 품질 분류를 실습 해보도록 하겠습니다.
----------------------------------------------------------------------------------------------------------------------------
# StratifiedKFold라이브러리를 이용해 5개의 fold로 나눔.
skf = StratifiedKFold(n_splits = 5)
X = train_one.drop('quality',axis = 1)
y = train_one['quality']
cnt = 1
acc = 0
for train_idx, valid_idx in skf.split(X,y):
train_data = train_one.iloc[train_idx]
valid_data = train_one.iloc[valid_idx]
# 모델 정의
model = LGBMClassifier()
# train_X 는 train_data에서 quality 를 제외한 모든 변수
# train_y 는 train_data의 qulity 변수
train_X = train_data.drop('quality',axis= 1)
train_y = train_data['quality']
# fit 메소드를 이용해 모델 학습
model.fit(train_X,train_y)
valid_X = valid_data.drop('quality',axis = 1)
valid_y = valid_data['quality']
# predict 메소드와 valid_X 데이터를 이용해 품질 예측
pred = model.predict(valid_X)
# 모델 정확도 출력
print(cnt," 번째 모델 정확도 : " ,accuracy_score(pred,valid_y))
acc += accuracy_score(pred,valid_y)
cnt+=1
print('모델 정확도 평균 : ',acc/5)
----------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # read_csv #스케일링 #stratified kfold #교차검증 #LGBM
done
✅
✅
done
✅
✅
✅
✅
done
✅
✅
✅
✅
done
✅
done+
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
done