데이스쿨 시계열 트랙2025: 대한민국 특정 도시 평균 기온 예측 AI 해커톤

알고리즘 | 정형 | 시계열 | 회귀 | MAE

1. 문제 정의 및 미션

본 대회는 딥러닝 기반 시계열 예측 모델을 개발하여 대한민국 특정 도시의 평균 기온을 예측하는 과제입니다. 참가자들은 다음과 같은 미션을 수행해야 합니다:

1.1 모델 개발

훈련 데이터(train.csv): 2015-01-01부터 2022-12-31까지의 일별 기상 데이터

목표: 14일(2주) 동안의 일별 평균 기온을 예측하는 Multi-Step Prediction 모델 구축


1.2 예측 수행

참가자들은 6개의 예측 시점에 대해 각각 14일간의 평균 기온을 예측해야 합니다:



1.3 결과 제출

모든 예측 시점의 결과를 통합하여 하나의 submission.csv 파일로 제출.



참가자들은 제공된 train.csv 파일을 사용하여 모델을 학습시키고, 각 예측 시점에 해당하는 test 파일을 활용하여 모델의 입력 시퀀스를 구성해야 합니다.

이를 통해 각 예측 기간의 14일간 일별 평균 기온을 예측하게 됩니다.

본 대회는 참가자들의 시계열 데이터 처리 능력, 딥러닝 모델 설계 및 최적화 능력, 그리고 장기 예측 성능을 종합적으로 평가하게 됩니다.

제출된 결과는 실제 관측된 평균 기온과 비교하여 평가되고, 리더 보드에 업데이트 될 예정입니다.


2. 평가


  • 평가산식 : NMAE (Normalized Mean Absolute Error)


본 대회의 모델 성능 평가는 NMAE(Normalized Mean Absolute Error)를 사용합니다. NMAE는 예측값과 실제값 간의 절대 오차를 정규화한 평균으로, 다음과 같은 특징을 가집니다:


1. 예측 오차의 크기를 직관적으로 이해할 수 있습니다.

2. 이상치에 덜 민감하여 안정적인 평가가 가능합니다.

3. 정규화를 통해 다른 스케일의 데이터셋 간 비교가 용이합니다.


NMAE의 수식은 다음과 같습니다:


NMAE = (1/n) * Σ(|y_true - y_pred| / y_true) * 100


여기서:

- n: 샘플의 수

- y_true: 실제 관측값

- y_pred: 모델의 예측값


NMAE는 백분율(%)로 표현되며, 값이 낮을수록 모델의 성능이 우수함을 의미합니다. 참가자들은 이 지표를 최소화하는 방향으로 모델을 최적화해야 합니다.


  • Public Score 및 Private Score 동일


3. 참여 규칙 및 해커톤 합격 기준

합격 기준 점수 : Private Score 0.369 이하

  • 합격시 코드 공유 페이지에 코드 및 pdf 파일을 업로드하여야 합니다.
  • 코드 공유를 할 때 '공개 설정' 을 '공개'로 설정하여야 합니다.


본 대회의 합격은 다음 세 가지 요건을 모두 충족하는 참가자에게 주어집니다:

1. 합격 점수:

2. 제출물:

   - 딥러닝 기반 시계열 예측 모델을 사용하여 학습 및 추론한 결과물을 제출해야 합니다.

   - 사용 가능한 모델의 예시:

     * 순환 신경망(RNN) 계열: LSTM, GRU 등

     * 합성곱 신경망(CNN) 기반 시계열 모델

   * 다층 퍼셉트론(MLP) 기반 모델

     * Transformer 기반 모델

     * 기타 딥러닝 기반의 시계열 예측에 적합한 모델


3. 간략 분석 보고서 제출:

 다음 내용을 포함한 PDF 파일을 제출해야 합니다:

 

 (1) 데이터 전처리 및 하이퍼 파라미터 튜닝 과정 설명

   (2) 학습-검증 과정에서의 epoch에 따른 학습 성능 곡선

   (3) 참가자가 자유롭게 선택한 검증 기간에 대한 정답값과 예측값의 비교 그래프


  • 주의사항 :
  • 본 기준은 참가자들의 학습과 제출에 대한 경험을 쌓기 위한 것으로, 결과물의 제출과 함께 과정에 대한 분석을 중요하게 평가합니다.


  • 1일 최대 제출 횟수 : 10회
  • 개인으로만 참여할 수 있습니다. (팀 구성 X)
  • 모든 AutoML 패키지 사용 불가능
  • 외부 데이터 사용 불가
  • 사전 학습 모델(Pre-trained Model) 사용 불가



3. 부정 행위 및 결격 사유


  • 아래 사항들은 모두 부정행위로 간주합니다.
  • 주어진 학습 데이터(train.csv) 이외의 데이터를 학습에 사용
  • 테스트 데이터를 학습에 사용 (* 테스트 데이터는 모델의 '추론' 과 제출 파일 생성에만 사용해주세요)
  • 외부에 공개된 원본 데이터를 사용
  • 사전 학습(pretrained) 모델 사용


  • 반드시 데이콘에서 받은 데이터만을 사용해주세요.


[중요]

  • 타인의 코드를 '그대로' 제출하는 것은 결격 사유입니다.
  • 대회 진행 중 부정행위가 의심되는 경우, 먼저 리더보드에서 기록이 숨김 처리됩니다.
  • 데이콘 측에서는 해당 참가자에게 기록 복구를 위한 코드 제출을 요청할 수 있습니다.
  • 해당 참가자가 대회 종료 3시간 전까지 코드를 제출하여 정상적인 코드임이 확인될 시 기록이 복구됩니다.
  • 데이콘은 투명하고 공정한 대회 운영을 위해 단 한번의 부정행위에도 엄격히 대응하고 있습니다.
  • 대회 종료 후 부정행위가 확인되거나 결격사유가 있을 경우, 리더보드에서 기록이 삭제되며 합격 기준에서 탈락됩니다
  • 데이콘은 부정행위를 엄격히 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다.
  • 자세한 사항은 다음의 링크를 참고해 주시기 바랍니다. https://dacon.io/notice/notice/13

 


4. 유의 사항

  • 모델 학습에서 검증 혹은 평가 데이터셋 활용 시 Data Leakage로 판단하여 실격 처리됩니다. (부정 행위)
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일을 선택해야 합니다.
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됩니다.
  • 대회 종료 후 리더보드 및 코드 공유 수상자 순위를 결정합니다.

 


5. 대회문의

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 [토크] - [DAKER! 대회 관련 문의] 페이지에 댓글을 남겨주시기 바랍니다.


대회 주요 일정

  1. 01.01

    대회 시작

  2. 12.31

    대회 종료

1. 문제 정의 및 미션

본 대회는 딥러닝 기반 시계열 예측 모델을 개발하여 대한민국 특정 도시의 평균 기온을 예측하는 과제입니다. 참가자들은 다음과 같은 미션을 수행해야 합니다:

1.1 모델 개발

훈련 데이터(train.csv): 2015-01-01부터 2022-12-31까지의 일별 기상 데이터

목표: 14일(2주) 동안의 일별 평균 기온을 예측하는 Multi-Step Prediction 모델 구축


1.2 예측 수행

참가자들은 6개의 예측 시점에 대해 각각 14일간의 평균 기온을 예측해야 합니다:



1.3 결과 제출

모든 예측 시점의 결과를 통합하여 하나의 submission.csv 파일로 제출.



참가자들은 제공된 train.csv 파일을 사용하여 모델을 학습시키고, 각 예측 시점에 해당하는 test 파일을 활용하여 모델의 입력 시퀀스를 구성해야 합니다.

이를 통해 각 예측 기간의 14일간 일별 평균 기온을 예측하게 됩니다.

본 대회는 참가자들의 시계열 데이터 처리 능력, 딥러닝 모델 설계 및 최적화 능력, 그리고 장기 예측 성능을 종합적으로 평가하게 됩니다.

제출된 결과는 실제 관측된 평균 기온과 비교하여 평가되고, 리더 보드에 업데이트 될 예정입니다.


2. 평가


  • 평가산식 : NMAE (Normalized Mean Absolute Error)


본 대회의 모델 성능 평가는 NMAE(Normalized Mean Absolute Error)를 사용합니다. NMAE는 예측값과 실제값 간의 절대 오차를 정규화한 평균으로, 다음과 같은 특징을 가집니다:


1. 예측 오차의 크기를 직관적으로 이해할 수 있습니다.

2. 이상치에 덜 민감하여 안정적인 평가가 가능합니다.

3. 정규화를 통해 다른 스케일의 데이터셋 간 비교가 용이합니다.


NMAE의 수식은 다음과 같습니다:


NMAE = (1/n) * Σ(|y_true - y_pred| / y_true) * 100


여기서:

- n: 샘플의 수

- y_true: 실제 관측값

- y_pred: 모델의 예측값


NMAE는 백분율(%)로 표현되며, 값이 낮을수록 모델의 성능이 우수함을 의미합니다. 참가자들은 이 지표를 최소화하는 방향으로 모델을 최적화해야 합니다.


  • Public Score 및 Private Score 동일


3. 참여 규칙 및 해커톤 합격 기준

합격 기준 점수 : Private Score 0.369 이하

  • 합격시 코드 공유 페이지에 코드 및 pdf 파일을 업로드하여야 합니다.
  • 코드 공유를 할 때 '공개 설정' 을 '공개'로 설정하여야 합니다.


본 대회의 합격은 다음 세 가지 요건을 모두 충족하는 참가자에게 주어집니다:

1. 합격 점수:

2. 제출물:

   - 딥러닝 기반 시계열 예측 모델을 사용하여 학습 및 추론한 결과물을 제출해야 합니다.

   - 사용 가능한 모델의 예시:

     * 순환 신경망(RNN) 계열: LSTM, GRU 등

     * 합성곱 신경망(CNN) 기반 시계열 모델

   * 다층 퍼셉트론(MLP) 기반 모델

     * Transformer 기반 모델

     * 기타 딥러닝 기반의 시계열 예측에 적합한 모델


3. 간략 분석 보고서 제출:

 다음 내용을 포함한 PDF 파일을 제출해야 합니다:

 

 (1) 데이터 전처리 및 하이퍼 파라미터 튜닝 과정 설명

   (2) 학습-검증 과정에서의 epoch에 따른 학습 성능 곡선

   (3) 참가자가 자유롭게 선택한 검증 기간에 대한 정답값과 예측값의 비교 그래프


  • 주의사항 :
  • 본 기준은 참가자들의 학습과 제출에 대한 경험을 쌓기 위한 것으로, 결과물의 제출과 함께 과정에 대한 분석을 중요하게 평가합니다.


  • 1일 최대 제출 횟수 : 10회
  • 개인으로만 참여할 수 있습니다. (팀 구성 X)
  • 모든 AutoML 패키지 사용 불가능
  • 외부 데이터 사용 불가
  • 사전 학습 모델(Pre-trained Model) 사용 불가



3. 부정 행위 및 결격 사유


  • 아래 사항들은 모두 부정행위로 간주합니다.
  • 주어진 학습 데이터(train.csv) 이외의 데이터를 학습에 사용
  • 테스트 데이터를 학습에 사용 (* 테스트 데이터는 모델의 '추론' 과 제출 파일 생성에만 사용해주세요)
  • 외부에 공개된 원본 데이터를 사용
  • 사전 학습(pretrained) 모델 사용


  • 반드시 데이콘에서 받은 데이터만을 사용해주세요.


[중요]

  • 타인의 코드를 '그대로' 제출하는 것은 결격 사유입니다.
  • 대회 진행 중 부정행위가 의심되는 경우, 먼저 리더보드에서 기록이 숨김 처리됩니다.
  • 데이콘 측에서는 해당 참가자에게 기록 복구를 위한 코드 제출을 요청할 수 있습니다.
  • 해당 참가자가 대회 종료 3시간 전까지 코드를 제출하여 정상적인 코드임이 확인될 시 기록이 복구됩니다.
  • 데이콘은 투명하고 공정한 대회 운영을 위해 단 한번의 부정행위에도 엄격히 대응하고 있습니다.
  • 대회 종료 후 부정행위가 확인되거나 결격사유가 있을 경우, 리더보드에서 기록이 삭제되며 합격 기준에서 탈락됩니다
  • 데이콘은 부정행위를 엄격히 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다.
  • 자세한 사항은 다음의 링크를 참고해 주시기 바랍니다. https://dacon.io/notice/notice/13

 


4. 유의 사항

  • 모델 학습에서 검증 혹은 평가 데이터셋 활용 시 Data Leakage로 판단하여 실격 처리됩니다. (부정 행위)
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일을 선택해야 합니다.
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됩니다.
  • 대회 종료 후 리더보드 및 코드 공유 수상자 순위를 결정합니다.

 


5. 대회문의

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 [토크] - [DAKER! 대회 관련 문의] 페이지에 댓글을 남겨주시기 바랍니다.


대회 주요 일정

  1. 01.01

    대회 시작
  2. 12.31

    대회 종료