분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Doge | public 1st, private 3rd
3가지 핵심으로 볼 수 있습니다.
- data cleaning
- 분산을 줄이기 위해서, 다양한 모델을 만들어서 앙상블 하는것에 포커싱
- 과소/과대추정되는 건물들에 한해서 post processing을 진행
최근에 바빠서 부연설명을 충분하게 달지 못한점 죄송합니다ㅜㅜ
후처리의 경우에는 train data의 마지막주를 test data 로 holdout set을 구축한 다음,
위의 학습/예측 프로세스를 모두 진행한 후 제 예측값과 실측값의 비율로 조정하였습니다.
하나 또 배워갑니다. 감사합니다 holdout 기법에 대해서 공부해봐야겠네요
안녕하세요! 시계열 머신러닝을 공부하기 위해 코드를 보며 이해하고 있습니다.
위의 댓글에 이어지는 질문인데, target_process가 holdout set을 구축하는 작업으로 이해할 수 있을까요?
그렇다면 target_process에서 일부 값을 np.nan으로 만든 뒤 interpolation을 수행하셨던데, 이 작업이 혹시 어떤 것을 의미하는지 알 수 있을까요?
비록 끝난지 시간이 좀 되었지만 궁금해서 이렇게 댓글 남깁니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 보면서 천천히 이해하면서 배우고 있습니다.
코드에서 target_process는 어떤 기준으로 조정하신건지 혹시 알 수 있을까요?