분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Baseline 코드를 수정하여 CNN을 적용해보았습니다.
Private 25위로 수상과는 거리가 크게 멀지만, 처음 참여했다는 데에 의미를 두고 코드를 공유합니다.
- 학습데이터에는 API를 이용하여 Target 값의 10분 전 수위를 추가하였습니다.
- 리더보드에 제출된 최종 결과는 epoch = 6000, batch_size = 1028로 두어 시간을 갖고 천천히 학습시켰습니다.
- score 함수는 '대회안내-규칙'에 언급된 평가 산식을 구현한 것입니다.
※ 평가 산식: RMSE / R_Squared_Score
제가 두서없이 말씀드렸습니다.
"검증에 필요한 6월 1일 ~ 7월 18일 까지의 데이터를 API로 불러오고, 그 중 예측 시점으로 부터 10분 전까지의 데이터를 검증데이터에 활용"했다는 말이 정확할 것 같네요.
아래는 자세한 설명 및 예시입니다. 참고 부탁드립니다.
- Baseline 코드와 달리 본 코드에서는 "10분전 까지의" 청담대교 수위, 잠수교 수위, 한강대교 수위, 행주대교 수위 및 기타 파생변수를 학습데이터에 활용하였습니다.
- 따라서, Test시에도 위 변수를 사용하기 위하여 API를 통해 예측시점으로 부터 "10분전 까지의" 데이터를 불러와 사용하게 되었습니다.
(API를 이용한 데이터 수집 과정은 아래의 "한강홍수통제소 OPEN API를 이용한 수위 데이터 수집"글을 참고하시면 좋을 듯 합니다.)
- 예) 본 대회의 Test기간(6월 1일 ~ 7월 18일)내에 해당하는 6월 2일 12:00 AM 의 수위를 예측하기 위해서 6월 1일 7:00 PM ~11:50 PM 까지의 수위 데이터를 API로 불러와 사용
아 자세한 설명 감사합니다! data leakage문제 때문에 궁금해서 여쭤봤었습니다. 좋은 코드 감사드립니다.!!!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 잘 읽었습니다!! 다름이 아니라 "학습데이터에는 API를 이용하여 Target 값의 10분 전 수위를 추가하였습니다."가 정확히 무슨 뜻인가요? 5/31일 데이터 한 개를 추가했다는 것인가요?