분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Random Forest 관련 문의 드립니다
안녕하세요
영화 리뷰감성 분석 2회차 프로그랭에서
모델학습 부분을 아래와 같이 바꾸고
n_estimators와 random_state 값을 바꾸어서 수행 해보니
오히려 성능이 떨어지는 검증 값이 나옵니다
혹시 성능을 향상 시킬 방법이 있으면 알려주시면 감사하겠습니다 ^^
==== 수행결과 검증 값
accuracy = 0.7871288888888889
3.model = RandomForestClassifier(n_estimators=10, random_state=0) : accuracy = 0.7707022222222222
4.model = RandomForestClassifier(n_estimators=2, random_state=2) :accuracy = 0.7222044444444444
===========================================
from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(n_estimators=10, random_state=5) # 1. 모델 선언
model.fit(X_train_vec, y_train) # 2. 모델 학습
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
random_state는 난수 발생을 위한 랜덤시드로, 성능 향상을 위한 최적화 대상은 아닙니다. n_estimators는 랜덤포레스트 학습 횟수를 의미하는데, 통상적으로 100, 500, 1000 정도를 선택합니다. 정확한 하이퍼파라미터 튜닝을 위해서는 validation accuracy를 기준으로 값을 변경하면 되겠습니다.