분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 7위, 16.8567] Robust Stacked Generalization
안녕하세요 :)
Robust Engineering을 활용한 Stacked Generalization 예측 모형입니다. (public: 17.29236, private: 16.8567)
1. Robust Engineering
- Median Aggregation
- IQR Transform
- Robust Scaling
2. Feature Extraction
- Time (성장 시기, 성장 일수)
- Month, Seasonal (성장 환경)
3. Stacking
- 총 8개의 예측 모형을 Ensemble
- LinearRegression, Ridge, OrthogonalMatchingPurshit, BayesianRidge, ARDRegression,
BaggingRegressor, GradientBoostingRegressor, LGBMRegressor
감사합니다.
네, 안녕하세요.
질문 늦게 확인했습니다.
평균과 중앙값 모두 정보 소실이 많이 일어날 수 있습니다.
하루 동안 극단 값이 많이 존재하여 이에 대한 영향을 최소화하고자 중앙값을 사용했습니다.
답변 감사합니다. 그러면 중앙값이 아닌 평균을 사용하지 않은 이유와 평균 중앙값을 둘 다 사용하지 않은 이유는 무엇인지 여쭤봐도 될까요?
실험적으로 평균을 사용했을 때보다 중앙값을 사용했을 때 성능이 좋았습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 코드 잘 보았습니다.
궁금한게 인덱스를 1일치로 줄이실 때 mean 값이 아닌 median으로 해준 이유가 있을까요?
median값으로 채우게 된다면 정보 소실이 많이 일어나지않을까요?