분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Lv1 모델링 python 파이썬 train_test_split() - (4)
안녕하세요. 👷♀️👷♂️
이번시간에는 train_test_split() 메소드의 stratify파라미터에 대해 알아보겠습니다.
stratify
: stratify 파라미터는 분류 문제를 다룰 때 매우 중요하게 활용되는 파라미터 값 입니다. stratify 값으로는 target 값을 지정해주면 됩니다.
stratify값을 target 값으로 지정해주면 target의 class 비율을 유지 한 채로 데이터 셋을 split 하게 됩니다. 만약 이 옵션을 지정해주지 않고 classification 문제를 다룬다면, 성능의 차이가 많이 날 수 있습니다.
--------------------------------------------------------------------------------------------------------------------------------------------
# 라이브러리 로딩
from sklearn.model_selection import train_test_split
#train_test_split() 메소드를 이용해 train/validation 데이터 나누기
# stratify 옵션을 활용하여 데이터 셋 split
x_train,x_valid, y_train, y_valid = train_test_split(train_x,train['category'],stratify = train['category'])
# y_train,y_valid 비율 확인 (value_counts())
print(y_train.value_counts())
print(y_valid.value_counts())
output :
2 10021
1 10003
0 9976
Name: category, dtype: int64
2 3341
1 3334
0 3325
Name: category, dtype: int64
--------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # train_test_split()
안녕하세요. 왼쪽눈썹왁싱님.
내용 수정 되었습니다.
감사합니다.
✅
✅
done
✅
done
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅
오늘의 파이썬 링크에서🌷Lv1 | 모델링 | 4/6 | train_test_split - (4) 클릭시 '오늘의 파이썬' 화면이 나옵니다. 확인 부탁드립니다.