커뮤니티 대회 교육

2022 UOS 빅데이터 알고리즘 경진대회

알고리즘 | 정형 | 시계열 | 수요 예측 | 회귀 | MAE

  • moneyIcon 상금 : 1,000 만원
  • 416명 D-13

1. 리더 보드

  • 평가 산식 : MAE (Mean Absolute Error, 평균 절대 오차)
  • Public score : 2022.01.01 ~ 2022.06.30의 실제 따릉이 대여량 데이터
  • Private score : 2022.01.01 ~ 2022.11.30의 실제 따릉이 대여량 데이터


2. 평가 방식

  • 1차 평가 : 리더보드 Private Score
  • 2차 평가 : 참가자격을 만족하고 수상을 원하는 코드 및 PPT 제출 팀 중 Private Score 상위 10팀 온라인 발표 평가
  • 2차 평가 기준


3. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

4. 외부 데이터 및 사전 학습 모델

  • 사용에 법적 제약이 없으며, 누구나 변경, 재배포할 수 있는 공개된 2021년 12월 31일 내에 해당하는 외부 데이터만 사용 가능
  • 사용한 외부 데이터의 출처 필수 기재
  • 2022년에 해당하는 모든 외부데이터는 사용 불가능 (예보 데이터 포함)
  • 사용에 법적 제약이 없으며 논문으로 공개된 사전 학습 모델(Pre-trained Model) 사용 가능
  • 사용한 사전 학습 모델의 출처 필수 기재
  • 단, 따릉이 공공데이터로 사전학습된 모델 사용 불가능

 

5. 코드 및 PPT 제출 규칙

  • 대회 종료 후 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 코드 공유 게시판에 기한 내에 제출 [게시글 제목에 팀명과 Private 순위 필수 기재]
  • 제출한 코드는 Private Score 복원이 가능해야 함

o   코드에 ‘/data’ 데이터 입/출력 경로 포함

o   코드 파일 확장자: .R, .rmd, .py, .ipynb

o   코드와 주석 인코딩: UTF-8

o   모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o   개발 환경(OS) 및 라이브러리 버전 기재

o   외부 데이터 사용 시 출처와 다운로드 링크

-> 외부 데이터 전처리 시 해당 코드도 필수로 포함

o   사전 학습 모델 사용 시 출처와 (별도 필요시) 다운로드 링크

  • 온라인 발표 평가 발표 PPT 자료 (필수)

o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성

o 각 팀원의 역할 명시

o 발표 시간 10분 분량으로 준비

  • 제출 목록

o   Private Score 복원이 가능하고 모든 과정(전처리, 학습, 추론)이 포함된 코드 파일

o 온라인 대면 평가 발표 PPT 자료

o 참가 자격을 증빙할 수 있는 서류 (dacon@dacon.io으로 제출) [메일 제출 시 팀명 필수 기재]

-> 팀원 모두 학부생 재학증명서 제출 (대회 기간 동안 재학생 상태임을 입증할 수 있어야함)


 

6. 유의 사항

  • 1일 최대 제출 횟수: 3 회
  • 사용 가능 언어: Python, R
  • Test 데이터의 기간(2022.01.01 ~ 2022.11.30)에 해당하는 모든 외부 데이터(예보 데이터 포함)로 모델 학습 시 실격 (리더보드 기록 삭제)
  • 단, Test 데이터 기간에 대한 모델의 예측 결과를 학습 및 추론에 활용 가능
  • Test 데이터의 기간(2022.01.01 ~ 2022.11.30)중에서 2022년에만 알 수 있는 특성을 활용하는 경우 Data Leakage로 실격 (리더보드 기록 삭제)
  • 2022년에 발생한 모든 사건은 전혀 알 수 없다 라고 가정하여 진행해야함
  • 현재는 2021.12.31로 설정되며, 2021.12.31까지의 정보만 활용 가능
  • 외부 데이터 및 사전학습 모델 규칙 위반 시 실격 (리더보드 기록 삭제)
  • 대회 진행 중 규칙 위반 사항이 의심되는 경우 코드 제출 요청을 할 수 있으며 요청 1일 이내 코드 미제출 혹은 규칙위반이 확인되었을 경우 실격 (리더보드 기록 삭제)
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일을 2개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?


대회 주요 일정

  1. 11.14

    대회 시작

  2. 12.05

    팀 병합 마감

  3. 12.12

    대회 종료

  4. 12.15

    코드 및 PPT 제출 마감

  5. 12.19

    온라인 발표 평가

  1. 12.20

    코드 평가

  2. 12.22

    최종 수상자 발표

  3. 12.23

    온라인 시상식

1. 리더 보드

  • 평가 산식 : MAE (Mean Absolute Error, 평균 절대 오차)
  • Public score : 2022.01.01 ~ 2022.06.30의 실제 따릉이 대여량 데이터
  • Private score : 2022.01.01 ~ 2022.11.30의 실제 따릉이 대여량 데이터


2. 평가 방식

  • 1차 평가 : 리더보드 Private Score
  • 2차 평가 : 참가자격을 만족하고 수상을 원하는 코드 및 PPT 제출 팀 중 Private Score 상위 10팀 온라인 발표 평가
  • 2차 평가 기준


3. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

4. 외부 데이터 및 사전 학습 모델

  • 사용에 법적 제약이 없으며, 누구나 변경, 재배포할 수 있는 공개된 2021년 12월 31일 내에 해당하는 외부 데이터만 사용 가능
  • 사용한 외부 데이터의 출처 필수 기재
  • 2022년에 해당하는 모든 외부데이터는 사용 불가능 (예보 데이터 포함)
  • 사용에 법적 제약이 없으며 논문으로 공개된 사전 학습 모델(Pre-trained Model) 사용 가능
  • 사용한 사전 학습 모델의 출처 필수 기재
  • 단, 따릉이 공공데이터로 사전학습된 모델 사용 불가능

 

5. 코드 및 PPT 제출 규칙

  • 대회 종료 후 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 코드 공유 게시판에 기한 내에 제출 [게시글 제목에 팀명과 Private 순위 필수 기재]
  • 제출한 코드는 Private Score 복원이 가능해야 함

o   코드에 ‘/data’ 데이터 입/출력 경로 포함

o   코드 파일 확장자: .R, .rmd, .py, .ipynb

o   코드와 주석 인코딩: UTF-8

o   모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o   개발 환경(OS) 및 라이브러리 버전 기재

o   외부 데이터 사용 시 출처와 다운로드 링크

-> 외부 데이터 전처리 시 해당 코드도 필수로 포함

o   사전 학습 모델 사용 시 출처와 (별도 필요시) 다운로드 링크

  • 온라인 발표 평가 발표 PPT 자료 (필수)

o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성

o 각 팀원의 역할 명시

o 발표 시간 10분 분량으로 준비

  • 제출 목록

o   Private Score 복원이 가능하고 모든 과정(전처리, 학습, 추론)이 포함된 코드 파일

o 온라인 대면 평가 발표 PPT 자료

o 참가 자격을 증빙할 수 있는 서류 (dacon@dacon.io으로 제출) [메일 제출 시 팀명 필수 기재]

-> 팀원 모두 학부생 재학증명서 제출 (대회 기간 동안 재학생 상태임을 입증할 수 있어야함)


 

6. 유의 사항

  • 1일 최대 제출 횟수: 3 회
  • 사용 가능 언어: Python, R
  • Test 데이터의 기간(2022.01.01 ~ 2022.11.30)에 해당하는 모든 외부 데이터(예보 데이터 포함)로 모델 학습 시 실격 (리더보드 기록 삭제)
  • 단, Test 데이터 기간에 대한 모델의 예측 결과를 학습 및 추론에 활용 가능
  • Test 데이터의 기간(2022.01.01 ~ 2022.11.30)중에서 2022년에만 알 수 있는 특성을 활용하는 경우 Data Leakage로 실격 (리더보드 기록 삭제)
  • 2022년에 발생한 모든 사건은 전혀 알 수 없다 라고 가정하여 진행해야함
  • 현재는 2021.12.31로 설정되며, 2021.12.31까지의 정보만 활용 가능
  • 외부 데이터 및 사전학습 모델 규칙 위반 시 실격 (리더보드 기록 삭제)
  • 대회 진행 중 규칙 위반 사항이 의심되는 경우 코드 제출 요청을 할 수 있으며 요청 1일 이내 코드 미제출 혹은 규칙위반이 확인되었을 경우 실격 (리더보드 기록 삭제)
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일을 2개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?


대회 주요 일정

  1. 11.14

    대회 시작
  2. 12.05

    팀 병합 마감
  3. 12.12

    대회 종료
  4. 12.15

    코드 및 PPT 제출 마감
  5. 12.19

    온라인 발표 평가
  6. 12.20

    코드 평가
  7. 12.22

    최종 수상자 발표
  8. 12.23

    온라인 시상식