청경채 성장 예측 AI 경진대회

[Private 7위, 16.8567] Robust Stacked Generalization

2022.09.22 18:02 2,170 조회 language

안녕하세요 :)

Robust Engineering을 활용한 Stacked Generalization 예측 모형입니다. (public: 17.29236, private: 16.8567)

1. Robust Engineering
  - Median Aggregation
  - IQR Transform
  - Robust Scaling
2. Feature Extraction
  - Time (성장 시기, 성장 일수)
  - Month, Seasonal (성장 환경)
3. Stacking
  - 총 8개의 예측 모형을 Ensemble
  - LinearRegression, Ridge, OrthogonalMatchingPurshit, BayesianRidge, ARDRegression, 
    BaggingRegressor, GradientBoostingRegressor, LGBMRegressor

감사합니다.

PDF
코드
로그인이 필요합니다
0 / 1000
쥬혁이
2022.11.29 19:33

안녕하세요 코드 잘 보았습니다.
궁금한게 인덱스를 1일치로 줄이실 때 mean 값이 아닌 median으로 해준 이유가 있을까요?
median값으로 채우게 된다면 정보 소실이 많이 일어나지않을까요?

GNOEYHEAT
2022.12.10 08:59

네, 안녕하세요.
질문 늦게 확인했습니다.

평균과 중앙값 모두 정보 소실이 많이 일어날 수 있습니다.
하루 동안 극단 값이 많이 존재하여 이에 대한 영향을 최소화하고자 중앙값을 사용했습니다.

쥬혁이
2022.12.10 17:50

답변 감사합니다. 그러면 중앙값이 아닌 평균을 사용하지 않은 이유와 평균 중앙값을 둘 다 사용하지 않은 이유는 무엇인지 여쭤봐도 될까요?

GNOEYHEAT
2022.12.13 13:09

실험적으로 평균을 사용했을 때보다 중앙값을 사용했을 때 성능이 좋았습니다!