분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv1 모델링 python 파이썬 train_test_split() - (3)
안녕하세요. 👨🏭👩🏭
이번시간에는 train_test_split() 메소드의 test_size 파라미터와 shuffle 파라미터 에 대해 알아보겠습니다.
--------------------------------------------------------------------------------------------------------------------------------------------
# 라이브러리 로딩
from sklearn.model_selection import train_test_split
#train_test_split() 메소드를 이용해 train/validation 데이터 나누기
# test_size = 0.2로 지정하여 데이터 셋 split
x_train,x_valid, y_train, y_valid = train_test_split(train_x,train['category'],test_size = 0.2)
print('x_train 데이터 사이즈', x_train.shape)
print('x_valid 데이터 사이즈', x_valid.shape)
print('y_train 데이터 사이즈', y_train.shape)
print('y_valid 데이터 사이즈', y_valid.shape)
output :
x_train 데이터 사이즈 (28000, 697226)
x_valid 데이터 사이즈 (12000, 697226)
y_train 데이터 사이즈 (28000,)
y_valid 데이터 사이즈 (12000,)
--------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
👨💻데이스쿨 로 Up-Skill Re-Skill👩🏻💻
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # train_test_split()
✅
✅
done
✅
done
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅