12월에도 스테이지1 무료 혜택은 쭈~욱 계속됩니다!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Random Forest, LB = 30.72567
Random Forest를 활용한 훈련 코드입니다.
코드는 아래 순서로 진행됩니다.
1. 데이터 전처리: "AlogP"의 결측치를 "LogD"로 대체합니다.
2. 데이터 분할: KFold를 활용하여 총 10개 Dataset으로 분리합니다.
3. Ensemble: 각 Dataset에서 얻은 모델로 예측한 후 평균하여 최종 결과를 냅니다.
네
Fold 안에 모델을 계속 재정의하셨는데 이유가 있을까요?
Fold 별로 학습 데이터에 따라 각각 학습시키려고 모델을 새로 만들었습니다.
랜덤 포레스트는 해당이 안될수도 있는데요,
fit()을 실행하는 경우 이미 학습된 모델에서 시작하는 경우도 있어서 새로 만들어 주었습니다.
감사합니다. 참고 많이 했습니다
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
SMILES는 사용안하신건가요?