Python 튜토리얼

기초

  • moneyIcon Prize : 교육
  • 9,999명 D-100720

 

Lv1 모델링 python 파이썬 train_test_split / LGBM (1)

2021.10.15 14:38 2,978 Views

안녕하세요. 👸🤴

이번시간에는 train_test_split() 으로 데이터셋을 split 하고 해당 데이터 셋을 이용해 모델을 학습하고 검증하는 방법에 대해 알아 보겠습니다.


학습에 사용 할 모델은 Light GBM 입니다.


✅Light GBM 복습 하러가기 ⏩ 개념 / 실습


Light GBM 모델을 선언 이후 학습을 위해서는 fit() 메소드를 사용합니다.

이때 fit() 메소드 내부에 다음과 같이 파라미터를 적용해주면 모델이 학습을 하면서 validation 데이터를 이용해 계속 검증을 진행 합니다.


model.fit(x_train, y_train, eval_set = [(x_train,y_train),(x_valid,y_valid)] )


--------------------------------------------------------------------------------------------------------------------------------------------

#train_test_split() 메소드를 이용해 train/validation 데이터 나누기 

# stratify 옵션을 활용하여 데이터 셋 split


x_train,x_valid, y_train, y_valid = train_test_split(train_x,train['category'],stratify = train['category'])


# LightGBM을 이용해 학습 및 검증 진행

from lightgbm import LGBMRegressor



model = LGBMRegressor(  )

model.fit(x_train,y_train,

          eval_set = [(x_train,y_train),(x_valid,y_valid)]

          )


output :

[1] training's l2: 0.625523 valid_1's l2: 0.627191

[2] training's l2: 0.591681 valid_1's l2: 0.59452

[3] training's l2: 0.563696 valid_1's l2: 0.567643

[4] training's l2: 0.539629 valid_1's l2: 0.545257

[5] training's l2: 0.519678 valid_1's l2: 0.526837

[6] training's l2: 0.502109 valid_1's l2: 0.509769

[7] training's l2: 0.487098 valid_1's l2: 0.496382

...

[97] training's l2: 0.285291 valid_1's l2: 0.342567

[98] training's l2: 0.284703 valid_1's l2: 0.342394

[99] training's l2: 0.284113 valid_1's l2: 0.342171

[100] training's l2: 0.283486 valid_1's l2: 0.342014

--------------------------------------------------------------------------------------------------------------------------------------------


[Colab 실습 링크]


↩️ 오늘의 파이썬 리스트


#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn  # train_test_split()


로그인이 필요합니다
0 / 1000
왼쪽눈썹왁싱
2021.11.03 12:12

moran
2022.01.04 15:54

dbnoid
2022.01.20 13:29

acebed
2022.03.11 14:52

done

비회원
2022.04.07 11:50

코튼클린
2023.01.17 16:25

done

highllight
2023.02.12 21:42

이전 글
인덱싱을 위한 Pandas .iloc .loc 사용 방법 데이터 분석 및 조작을위한
Competition - Python 튜토리얼
Likes 4
Views 1,706
Comments 0
일 년 전
현재 글
Lv1 모델링 python 파이썬 train_test_split / LGBM (1)
Competition - Python 튜토리얼
Likes 5
Views 2,978
Comments 7
2년 전
다음 글
다음 글이 존재하지 않습니다.