분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Random Forest 관련 문의 드립니다
안녕하세요
영화 리뷰감성 분석 2회차 프로그랭에서
모델학습 부분을 아래와 같이 바꾸고
n_estimators와 random_state 값을 바꾸어서 수행 해보니
오히려 성능이 떨어지는 검증 값이 나옵니다
혹시 성능을 향상 시킬 방법이 있으면 알려주시면 감사하겠습니다 ^^
==== 수행결과 검증 값
accuracy = 0.7871288888888889
3.model = RandomForestClassifier(n_estimators=10, random_state=0) : accuracy = 0.7707022222222222
4.model = RandomForestClassifier(n_estimators=2, random_state=2) :accuracy = 0.7222044444444444
===========================================
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(n_estimators=10, random_state=5) # 1. 모델 선언
model.fit(X_train_vec, y_train) # 2. 모델 학습
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
random_state는 난수 발생을 위한 랜덤시드로, 성능 향상을 위한 최적화 대상은 아닙니다. n_estimators는 랜덤포레스트 학습 횟수를 의미하는데, 통상적으로 100, 500, 1000 정도를 선택합니다. 정확한 하이퍼파라미터 튜닝을 위해서는 validation accuracy를 기준으로 값을 변경하면 되겠습니다.