대구 교통사고 피해 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 교통 | RMSLE | 정성평가

  • moneyIcon 상금 : 1,000만원
  • 2,253명 마감

1. 리더보드

  • 심사 기준: RMSLE(Root Mean Squared Logarithmic Error) of ECLO
  • ECLO: 인명피해 심각도(Equivalent Casualty Loss Only)
  • ECLO = 사망자수 * 10 + 중상자수 * 5 + 경상자수 * 3 + 부상자수 * 1
  • 다른 유형의 사고들을 부상자 기준으로 환산하여 사고의 심각 정도와 위험도를 표현하는 방법
  • 부상자: 교통사고로 인하여 5일 미만의 치료를 요하는 부상을 입은 경우 
  • 제출물에 음수값이 존재할 경우 에러 발생
  • Public Score: 전체 테스트 데이터 중 30%
  • Private Score: 전체 테스트 데이터 중 70%


2. 평가

  • 1차 평가: 리더보드 Private Score
  • 2차 평가: Private Score 상위 10팀 코드 및 PPT 제출 후 코드 평가와 발표 평가
  • 발표평가 기준:


3. 참여

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 단체 혹은 기관 참여시 별도의 절차가 필요합니다. (More > 공지사항> 게시글 확인)
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5명

                   * 동일인이 개인 또는 복수팀에 중복하여 등록 불가.

  • 1일 제출 가능 횟수: 3회

 

4. 외부 데이터 및 사전 학습 모델

  • 사용 가능한 외부데이터 채널
  • 대구 빅데이터활용센터 (전체 데이터셋 활용을 위해서는 직접 대구 빅데이터활용센터 방문)
  • 한국자동차연구원 자동차데이터 포털
  • 공공데이터포털 (2023.11.20 추가)
  • 단, 해당 출처 이외의 출처를 가지는 외부데이터는 사용 금지
  • 대구 빅데이터활용센터에서 제공하는 전체 데이터셋을 활용하기 위해서는 직접 센터를 방문하여 사내망 사용
  • 또한 2021.12.31 23:59:59 이후 구축된 데이터 역시 활용할 수 없음
  • 이는 데이터(전체 데이터 파일이 아닌 파일 내부의 한 개의 행 단위) 자체가 생성된 시간을 기준으로 판단 (2023.11.30 15:34 설명추가)
  • 사용에 법적 제한이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
  • 참가자 본인이 외부 데이터로 사전 학습 모델을 추가 학습시켜 사용하는 것은 불가능


5. 코드 및 발표자료 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 코드 공유 게시판에 기한 내 제출
  • 제출한 코드는 Private Score 복원이 가능해야 함

o  코드에 ‘/data’ 데이터 입/출력 경로 포함

o  코드 파일 확장자: .R, .rmd, .py, .ipynb

o  코드와 주석 인코딩: UTF-8

o  모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o  개발 환경(OS) 및 라이브러리 버전 기재

  • 발표 평가 PPT 자료

o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성

  • 제출 파일 목록

o Private Score 복원이 가능한 코드 파일

o Private Score 복원이 가능한 모델 weight 파일

o 발표 평가 PPT 자료

o 외부데이터를 사용한 경우, 해당 외부데이터와 그 출처

  • 코드와 PPT 모두 제출해야 수상이 가능합니다.


6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 현재는 2021.12.31 23:59:59으로 설정됨
  • 따라서, 2022.01.01 00:00:00부터 알 수 있는 특성을 활용하는 경우 Data Leakage로 실격 (리더보드 기록 삭제)
  • 2022.01.01 00:00:00부터 발생한 모든 사건은 전혀 알 수 없다고 가정하여 진행해야함
  • Pseudo Labeling은 사용 불가
  • 또한 2021.12.31 23:59:59 이후 구축된 데이터 역시 활용할 수 없음
  • 이는 데이터(전체 데이터 파일이 아닌 파일 내부의 한 개의 행 단위) 자체가 생성된 시간을 기준으로 판단 (2023.11.30 15:34 설명추가)
  • Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 엄격히 금지하고 있으며, 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 링크를 참고해 주시기 바랍니다. https://dacon.io/notice/notice/13


7. 문의

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해 주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 [토크] 페이지 대회 문의 게시글에 댓글을 올려 주시기 바랍니다.

대회 주요 일정

  1. 11.15

    대회 시작

  2. 12.04

    팀 병합 마감

  3. 12.11

    대회 종료

  4. 12.13

    코드 및 PPT 제출

  5. 12.15

    발표 평가

  1. 12.18

    코드 평가

  2. 12.19

    최종 수상자 발표

  3. 12.20

    시상식

1. 리더보드

  • 심사 기준: RMSLE(Root Mean Squared Logarithmic Error) of ECLO
  • ECLO: 인명피해 심각도(Equivalent Casualty Loss Only)
  • ECLO = 사망자수 * 10 + 중상자수 * 5 + 경상자수 * 3 + 부상자수 * 1
  • 다른 유형의 사고들을 부상자 기준으로 환산하여 사고의 심각 정도와 위험도를 표현하는 방법
  • 부상자: 교통사고로 인하여 5일 미만의 치료를 요하는 부상을 입은 경우 
  • 제출물에 음수값이 존재할 경우 에러 발생
  • Public Score: 전체 테스트 데이터 중 30%
  • Private Score: 전체 테스트 데이터 중 70%


2. 평가

  • 1차 평가: 리더보드 Private Score
  • 2차 평가: Private Score 상위 10팀 코드 및 PPT 제출 후 코드 평가와 발표 평가
  • 발표평가 기준:


3. 참여

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 단체 혹은 기관 참여시 별도의 절차가 필요합니다. (More > 공지사항> 게시글 확인)
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5명

                   * 동일인이 개인 또는 복수팀에 중복하여 등록 불가.

  • 1일 제출 가능 횟수: 3회

 

4. 외부 데이터 및 사전 학습 모델

  • 사용 가능한 외부데이터 채널
  • 대구 빅데이터활용센터 (전체 데이터셋 활용을 위해서는 직접 대구 빅데이터활용센터 방문)
  • 한국자동차연구원 자동차데이터 포털
  • 공공데이터포털 (2023.11.20 추가)
  • 단, 해당 출처 이외의 출처를 가지는 외부데이터는 사용 금지
  • 대구 빅데이터활용센터에서 제공하는 전체 데이터셋을 활용하기 위해서는 직접 센터를 방문하여 사내망 사용
  • 또한 2021.12.31 23:59:59 이후 구축된 데이터 역시 활용할 수 없음
  • 이는 데이터(전체 데이터 파일이 아닌 파일 내부의 한 개의 행 단위) 자체가 생성된 시간을 기준으로 판단 (2023.11.30 15:34 설명추가)
  • 사용에 법적 제한이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
  • 참가자 본인이 외부 데이터로 사전 학습 모델을 추가 학습시켜 사용하는 것은 불가능


5. 코드 및 발표자료 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 코드 공유 게시판에 기한 내 제출
  • 제출한 코드는 Private Score 복원이 가능해야 함

o  코드에 ‘/data’ 데이터 입/출력 경로 포함

o  코드 파일 확장자: .R, .rmd, .py, .ipynb

o  코드와 주석 인코딩: UTF-8

o  모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o  개발 환경(OS) 및 라이브러리 버전 기재

  • 발표 평가 PPT 자료

o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성

  • 제출 파일 목록

o Private Score 복원이 가능한 코드 파일

o Private Score 복원이 가능한 모델 weight 파일

o 발표 평가 PPT 자료

o 외부데이터를 사용한 경우, 해당 외부데이터와 그 출처

  • 코드와 PPT 모두 제출해야 수상이 가능합니다.


6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 현재는 2021.12.31 23:59:59으로 설정됨
  • 따라서, 2022.01.01 00:00:00부터 알 수 있는 특성을 활용하는 경우 Data Leakage로 실격 (리더보드 기록 삭제)
  • 2022.01.01 00:00:00부터 발생한 모든 사건은 전혀 알 수 없다고 가정하여 진행해야함
  • Pseudo Labeling은 사용 불가
  • 또한 2021.12.31 23:59:59 이후 구축된 데이터 역시 활용할 수 없음
  • 이는 데이터(전체 데이터 파일이 아닌 파일 내부의 한 개의 행 단위) 자체가 생성된 시간을 기준으로 판단 (2023.11.30 15:34 설명추가)
  • Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 엄격히 금지하고 있으며, 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 링크를 참고해 주시기 바랍니다. https://dacon.io/notice/notice/13


7. 문의

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해 주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 [토크] 페이지 대회 문의 게시글에 댓글을 올려 주시기 바랍니다.

대회 주요 일정

  1. 11.15

    대회 시작
  2. 12.04

    팀 병합 마감
  3. 12.11

    대회 종료
  4. 12.13

    코드 및 PPT 제출
  5. 12.15

    발표 평가
  6. 12.18

    코드 평가
  7. 12.19

    최종 수상자 발표
  8. 12.20

    시상식