Python 튜토리얼

기초

  • moneyIcon 상금 : 교육
  • 9,999명 D-100720

 

Lv1 모델링 python 파이썬 train_test_split() - (2)

2021.10.13 09:23 3,360 조회

안녕하세요. 👨‍🏭👩‍🏭

이번시간에는 train_test_split() 메소드의 사용법에 대해 알아보도록 하겠습니다.


train_test_split()을 이용한 train / validation(test) 분리🚧


train_test_split 함수를 통해 단 1줄로 깔끔하게 분리할 수 있습니다.

패키지는 sklearn.model_selection에 있습니다.


train_test_split 메소드는 총 4개의 값을 반환하고 2개의 값을 필수적으로 채워주어야 합니다.

반환 하는 값은 학습에 사용할 X,y 값, 검증에 사용할 X,y 값 이렇게 총 4개의 값을 반환하고, 입력값으로는 원본 데이터의 X,y을 채워주어야 합니다.


--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

# 라이브러리 로딩

from sklearn.model_selection import train_test_split


x_train,x_valid, y_train, y_valid = train_test_split(train_x,train['category'])


print('x_train 데이터 사이즈', x_train.shape)

print('x_valid 데이터 사이즈', x_valid.shape)

print('y_train 데이터 사이즈', y_train.shape)

print('y_valid 데이터 사이즈', y_valid.shape)



output :

x_train 데이터 사이즈 (30000, 697226)

x_valid 데이터 사이즈 (10000, 697226)

y_train 데이터 사이즈 (30000,)

y_valid 데이터 사이즈 (10000,)

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트


#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn  # train_test_split()


로그인이 필요합니다
0 / 1000
왼쪽눈썹왁싱
2021.11.03 12:01

moran
2022.01.04 15:50

dbnoid
2022.01.20 13:23

acebed
2022.03.11 14:52

done

비회원
2022.04.07 11:26

코튼클린
2023.01.17 16:25

done

highllight
2023.02.12 17:45

이전 글
인덱싱을 위한 Pandas .iloc .loc 사용 방법 데이터 분석 및 조작을위한
대회 - Python 튜토리얼
좋아요 4
조회 1,706
댓글 0
일 년 전
현재 글
Lv1 모델링 python 파이썬 train_test_split() - (2)
대회 - Python 튜토리얼
좋아요 6
조회 3,360
댓글 7
2년 전
다음 글
다음 글이 존재하지 않습니다.