2023 전력사용량 예측 AI 경진대회

알고리즘 | 정형 | 시계열 | 에너지 | SMAPE

  • moneyIcon 상금 : 2,000만원
  • 2,717명 마감

 

1th private 5.81 solution

2023.09.01 13:12 4,088 조회 language

모두 고생하셨습니다.
외부 파일은 따로 없습니다.

Linux version: 5.15.120+
Python version: 3.10.12 | packaged by conda-forge | (main, Jun 23 2023, 22:40:32) [GCC 12.3.0]
xgboost version: 1.7.6
pandas version: 1.5.3
numpy version: 1.23.5
optuna version: 3.2.0

PDF
코드
로그인이 필요합니다
0 / 1000
ji.n._.n.ii
2023.09.01 15:13

올려주셔서 감사합니다. 많이 배우겠습니다.

박솜
2023.09.03 07:35

감사합니다.

똥안
2023.09.02 09:35

고생하셨습니다.
건물별만 생각하고 있었는데 전체건물 모델링도 가능했군요.
전체건물, 건물타입, 건물별 앙상블이 키였네요.

박솜
2023.09.03 07:36

운이 잘 따라준것 같습니다.

basslibrary
2023.09.02 16:38

이번 대회에 처음 참가해서 예측점수와 제출점수 사이의 차이가 커서 많이 고생했습니다.
코드를 보니, ratio_values 또는 ratio2 함수내의 값인 0.98~0.99 사이의 값을 선택한 방법이 궁금합니다.
앙상블시 한쪽에 1.0보다 작은 값을 사용하면, 다른 값에는 1.0보다 큰 값을 사용해서 평균 1.0이 되도록 하는 걸로 아는데,
코드를 보면 작은 값만 곱해서, 결과적으로 값이 작게 나오게 한 것으로 보입니다.
이를 선택하는 별도의 튜닝 방법이 있는지 궁금합니다.

박솜
2023.09.03 07:37

summer feature가 있거나 week, month를 category로 지정하면
ppt에 있는것처럼 기존값보다 현저하게 낮게 예측했는데, public score는 크게 차이가 없었고 (summer 5.4 / no summer 5.6)
앙상블하니 큰 폭으로 점수 상승이 있었습니다.(5.0) 이는 둘의 평균 정도가 정답에 가깝다는 뜻이라고 판단되었고
둘의 평균에서 LB 점수값이 더 좋은 summer쪽에 더 가깝다고 생각했습니다.
그래서 summer쪽에 가중치를 더 주었고 이는 값이 낮아지는 방향입니다.
전체에 가한 이유은 scale을 제외한 파형 자체가 큰 폭으로 상승이 있었던 앙상블한게 낫지 않을까? 해서 그렇게 했습니다.

Gam
2023.09.02 17:00

어떻게 공부하고 계신건지 배우고싶어요 ㅠㅠ

박솜
2023.09.03 07:36

특별한 방법은 없고... 그냥 시간을 많이 투자하는편입니당..

KillingdATa
2023.09.06 17:07

두번째 optuna 튜닝 시 date column이 없어 오류가 발생하는데 튜닝 전에  train, test get을 다시 해줘야 하나요?

박솜
2023.09.06 17:48

train, test = get_train_and_test_data('all')
이거를 먼저 실행하고 돌리는게 맞습니다!

happydays
2023.09.14 16:30

안녕하세요, 공유해주신 발표자료와 코드 잘 보았습니다.
ratio_values = [0.98, 0.975, 0.975, 0.99, 0.99, 0.985, 0.985]를 설정하신 방법에 대해 여쭙고 싶습니다.
감사합니다.

마민수
2023.10.30 15:44

감사합니다. 도움이 많이 되었습니다.