#오늘의 파이썬 #1일1오파 #파이썬 # python

매일 오전10시 업로드, Dacon Daily Python Camp. 1일1오파 격파하기!

  • moneyIcon Prize : 교육
  • 30Team D-101513

 

Lv2 튜닝 2/4 python 파이썬 변수 제거

2021.07.02 16:14 1,430 Views

변수중요도가 낮은 피쳐를 파악하고 나면 차례대로 하나씩 피쳐를 제거하면서 모델을 새로 훈련할 수 있습니다. 각 모델로 예측하여 성능을 비교해보겠습니다.


우선 id 피쳐는 예측에 의미가 없는 피쳐입니다. id 와 count 를 drop 한 X_train_1 훈련 df 을 새로 생성합니다. 예측을 할 때 test 는 훈련 셋과 동일한 피쳐를 가져야 합니다. 따라서 동일하게 피쳐를 drop 한 test_1 df 를 생성해줍니다.


hour_bef_windspeed 와 hour_bef_pm2.5 피쳐에 관하여도 추가로 drop 을 수행하면서 위의 과정을 반복해보세요. 그럼 총 3 쌍의 X_train 셋과 test 셋이 생성됩니다.


이에 따라 각 모델로 예측한 예측값들을 submission 에 저장한 후, 리더보드에 제출해 점수를 비교해보세요.



# X_train 에서 drop 할 피쳐의 경우의 수 대로 3개의 X_train 을 생성하세요.

X_train_1 = train.drop(['drop 할 피쳐'], axis=1)

# 각 train 에 따라 동일하게 피쳐를 drop 한 test 셋들을 생성하세요.

test_1 = test.drop(['drop 할 피쳐'], axis = 1)

# 각 X_train 에 대해 모델 훈련을 해주세요.

model_input_var1 = RandomForestRegressor(criterion = 'mse')
model_input_var1.fit(X_train_1, Y_train)

# 각 모델로 test 셋들을 예측해주세요.

y_pred_1 = model_input_var1.predict(test_1)

# 각 결과들을 submission 파일로 저장해주세요.

submission_1 = pd.read_csv('data/submission.csv')
submission_1['count'] = y_pred_1
submission_1.to_csv('sub_1.csv', index = False)


[Colab 실습 링크]


⬅️Lv2 튜닝 1/5 랜덤포레스트 변수중요도 확인 /

Lv2 튜닝 3/5 하이퍼파라미터 / GirdSearch 개념 ➡️

↩️ 오늘의 파이썬 리스트


#데이콘 #데이콘_101 #파이썬 #머신러닝 #딥러닝 #인공지능 #앙상블 #의사결정나무 #코랩 #데이터 #데이터분석 #판다스 #넘파이 #데이터사이언티스트 #AI #Python # Pandas #Numpy #lightgbm #read_csv #DACON #kaggle #sckit-learn

정장입고시퍼요
2021.08.02 15:50

done

분석을할상인가
2021.08.06 00:05

해만이
2021.08.17 04:40

done

세라자데
2021.08.30 15:25

B-Jay
2021.08.31 22:54


phu
2021.09.06 20:59

DSJY
2021.09.08 18:10

다욤
2021.09.12 18:52

찬찬이
2021.09.24 14:52

changhyeon
2021.09.29 21:01

done

Holte
2021.09.30 12:47

가르치조림
2021.11.04 14:38

coddinggoldfish
2021.11.15 23:47

yulia.
2021.11.16 21:06

cberrys
2021.11.17 21:39


지금노플
2021.12.08 10:40

sotanfdl
2021.12.09 18:36

done

Hod0ri
2021.12.10 21:50

matthew624
2021.12.13 00:07


Soohobi
2021.12.15 15:52

녹삭
2021.12.18 18:53

done

River-T
2021.12.18 23:47

moran
2021.12.27 14:49

s_nana
2021.12.28 10:56

암냠냠
2021.12.29 00:42

삭제된 댓글입니다

MMMMMMMMMMMMMMMMMMMM
2022.01.01 04:01

done

201702018
2022.01.05 17:16

cm
2022.01.05 23:17

하랴랴
2022.01.06 19:37

done

inuin
2022.01.14 19:50

done

jj150618
2022.01.17 00:51

dbnoid
2022.01.18 18:50

hijihyo
2022.01.18 23:03

done

djffjdEndEkd
2022.01.22 19:54

done

로그인이 필요합니다
0 / 1000