팔당댐 홍수 안전운영에 따른 한강 수위예측 AI 경진대회

Baseline 코드를 수정하여 CNN을 적용해보았습니다.

2022.09.12 23:35 1,905 조회 language

Private 25위로 수상과는 거리가 크게 멀지만, 처음 참여했다는 데에 의미를 두고 코드를 공유합니다.

- 학습데이터에는 API를 이용하여 Target 값의 10분 전 수위를 추가하였습니다.
- 리더보드에 제출된 최종 결과는 epoch =  6000, batch_size = 1028로 두어 시간을 갖고 천천히 학습시켰습니다.
- score 함수는 '대회안내-규칙'에 언급된 평가 산식을 구현한 것입니다.
  ※ 평가 산식: RMSE / R_Squared_Score

코드
로그인이 필요합니다
0 / 1000
비회원
2022.09.13 01:13

코드 잘 읽었습니다!! 다름이 아니라 "학습데이터에는 API를 이용하여 Target 값의 10분 전 수위를 추가하였습니다."가 정확히 무슨 뜻인가요? 5/31일 데이터 한 개를 추가했다는 것인가요? 

티프
2022.09.13 03:00

제가 두서없이 말씀드렸습니다.
"검증에 필요한 6월 1일 ~ 7월 18일 까지의 데이터를 API로 불러오고, 그 중 예측 시점으로 부터 10분 전까지의 데이터를 검증데이터에 활용"했다는 말이 정확할 것 같네요.
아래는 자세한 설명 및 예시입니다. 참고 부탁드립니다.

- Baseline 코드와 달리 본 코드에서는 "10분전 까지의" 청담대교 수위, 잠수교 수위, 한강대교 수위, 행주대교 수위 및 기타 파생변수를 학습데이터에 활용하였습니다.
- 따라서, Test시에도 위 변수를 사용하기 위하여 API를 통해 예측시점으로 부터 "10분전 까지의" 데이터를 불러와 사용하게 되었습니다.
(API를 이용한 데이터 수집 과정은 아래의 "한강홍수통제소 OPEN API를 이용한 수위 데이터 수집"글을 참고하시면 좋을 듯 합니다.)
- 예) 본 대회의 Test기간(6월 1일 ~ 7월 18일)내에 해당하는 6월 2일 12:00 AM 의 수위를 예측하기 위해서 6월 1일 7:00 PM ~11:50 PM 까지의 수위 데이터를 API로 불러와 사용

비회원
2022.09.13 04:05

아 자세한 설명 감사합니다! data leakage문제 때문에 궁금해서 여쭤봤었습니다. 좋은 코드 감사드립니다.!!!