[1주년 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 5위] Stacking Quantile Regression 태양광 발전량
LGBM, RandomForest, MLP, CNN, LSTM, CNN-LSTM 을 stacking 하여 선형 ensemble한 모델입니다.
학습 시간은 어느정도 걸렸나요?
2080ti 한장으로 두시간 정도 걸렸던것 같습니다.
base 모델과 (ensemble을 위한) meta 모델을 합치면 학습 모델 개수가 100개가 넘습니다
사실 모델 complexity는 낮은 편으로 모델 자체의 크기나 예측 속도는 무겁지 않지만
batch size가 작아서 오래걸립니다
DHI, DNI는 pvlib 패키지 통해서 불러오신건가요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
다들 고생 많으셨습니다.
base 모델의 layer, unit 개수나 hyper parameter 튜닝할 시간은 없었어서
단순한 구조의 base model을 다양하게 구성하여 stacking ensemble했습니다.
overfitting이 상당히 잘 일어나서 batch size를 작게 셋팅하여
학습 데이터의 randomness를 높혔습니다.
batch size가 작다보니 모델이 복잡하지 않은데도 학습시간은 오래걸립니다.
궁금하신점은 댓글로 남겨주세요