분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Python 튜토리얼
Lv2 튜닝 2/4 python 파이썬 변수 제거
변수중요도가 낮은 피쳐를 파악하고 나면 차례대로 하나씩 피쳐를 제거하면서 모델을 새로 훈련할 수 있습니다. 각 모델로 예측하여 성능을 비교해보겠습니다.
우선 id 피쳐는 예측에 의미가 없는 피쳐입니다. id 와 count 를 drop 한 X_train_1 훈련 df 을 새로 생성합니다. 예측을 할 때 test 는 훈련 셋과 동일한 피쳐를 가져야 합니다. 따라서 동일하게 피쳐를 drop 한 test_1 df 를 생성해줍니다.
hour_bef_windspeed 와 hour_bef_pm2.5 피쳐에 관하여도 추가로 drop 을 수행하면서 위의 과정을 반복해보세요. 그럼 총 3 쌍의 X_train 셋과 test 셋이 생성됩니다.
이에 따라 각 모델로 예측한 예측값들을 submission 에 저장한 후, 리더보드에 제출해 점수를 비교해보세요.
# X_train 에서 drop 할 피쳐의 경우의 수 대로 3개의 X_train 을 생성하세요. X_train_1 = train.drop(['drop 할 피쳐'], axis=1) # 각 train 에 따라 동일하게 피쳐를 drop 한 test 셋들을 생성하세요. test_1 = test.drop(['drop 할 피쳐'], axis = 1) # 각 X_train 에 대해 모델 훈련을 해주세요. model_input_var1 = RandomForestRegressor(criterion = 'mse') model_input_var1.fit(X_train_1, Y_train) # 각 모델로 test 셋들을 예측해주세요. y_pred_1 = model_input_var1.predict(test_1) # 각 결과들을 submission 파일로 저장해주세요. submission_1 = pd.read_csv('data/submission.csv') submission_1['count'] = y_pred_1 submission_1.to_csv('sub_1.csv', index = False)
⬅️Lv2 튜닝 1/5 랜덤포레스트 변수중요도 확인 /
Lv2 튜닝 3/5 하이퍼파라미터 / GirdSearch 개념 ➡️
↩️ 오늘의 파이썬 리스트
#데이콘 #데이콘_101 #파이썬 #머신러닝 #딥러닝 #인공지능 #앙상블 #의사결정나무 #코랩 #데이터 #데이터분석 #판다스 #넘파이 #데이터사이언티스트 #AI #Python # Pandas #Numpy #lightgbm #read_csv #DACON #kaggle #sckit-learn
✅
done
✅
✅
✅
✅
✅
✅
done
✅
✅
✅
✅
✅
✅
done
✅
✅
✅
done
✅
✅
✅
삭제된 댓글입니다
done
✅
✅
done
done
✅
✅
done
done
done
✅
✅
✅
✅
✅
✅
done
✅
✅
✅
✅
done
✅
✅
✅
✅
✅
✅
✅
✅
✅
✅
done
✅
✅
done
✅
✅
완료
done
✅
✅
✅
✅
done
done
done
done
✅
✅
✅
done+
done
✅
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
done