분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv1 모델링 python 파이썬 train_test_split / LGBM (1)
안녕하세요. 👸🤴
이번시간에는 train_test_split() 으로 데이터셋을 split 하고 해당 데이터 셋을 이용해 모델을 학습하고 검증하는 방법에 대해 알아 보겠습니다.
학습에 사용 할 모델은 Light GBM 입니다.
Light GBM 모델을 선언 이후 학습을 위해서는 fit() 메소드를 사용합니다.
이때 fit() 메소드 내부에 다음과 같이 파라미터를 적용해주면 모델이 학습을 하면서 validation 데이터를 이용해 계속 검증을 진행 합니다.
model.fit(x_train, y_train, eval_set = [(x_train,y_train),(x_valid,y_valid)] )
--------------------------------------------------------------------------------------------------------------------------------------------
#train_test_split() 메소드를 이용해 train/validation 데이터 나누기
# stratify 옵션을 활용하여 데이터 셋 split
x_train,x_valid, y_train, y_valid = train_test_split(train_x,train['category'],stratify = train['category'])
# LightGBM을 이용해 학습 및 검증 진행
from lightgbm import LGBMRegressor
model = LGBMRegressor( )
model.fit(x_train,y_train,
eval_set = [(x_train,y_train),(x_valid,y_valid)]
)
output :
[1] training's l2: 0.625523 valid_1's l2: 0.627191
[2] training's l2: 0.591681 valid_1's l2: 0.59452
[3] training's l2: 0.563696 valid_1's l2: 0.567643
[4] training's l2: 0.539629 valid_1's l2: 0.545257
[5] training's l2: 0.519678 valid_1's l2: 0.526837
[6] training's l2: 0.502109 valid_1's l2: 0.509769
[7] training's l2: 0.487098 valid_1's l2: 0.496382
...
[97] training's l2: 0.285291 valid_1's l2: 0.342567
[98] training's l2: 0.284703 valid_1's l2: 0.342394
[99] training's l2: 0.284113 valid_1's l2: 0.342171
[100] training's l2: 0.283486 valid_1's l2: 0.342014
--------------------------------------------------------------------------------------------------------------------------------------------
↩️ 오늘의 파이썬 리스트
#데이콘_101 #AI #머신러닝 #딥러닝 #파이썬 #파이선 #데이터분석 #데이터사이언티스트 #코랩 #Python #colab #kaggle #pandas #numpy #sckit-learn # train_test_split()
✅
✅
done
✅
done
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
✅