대구 교통사고 피해 예측 AI 경진대회

알고리즘 | 정형 | 회귀 | 교통 | RMSLE | 정성평가

상금 1,000만 원
2,394명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

1. 리더보드

심사 기준: RMSLE(Root Mean Squared Logarithmic Error) of ECLO
ECLO: 인명피해 심각도(Equivalent Casualty Loss Only)
ECLO = 사망자수 * 10 + 중상자수 * 5 + 경상자수 * 3 + 부상자수 * 1
다른 유형의 사고들을 부상자 기준으로 환산하여 사고의 심각 정도와 위험도를 표현하는 방법
부상자: 교통사고로 인하여 5일 미만의 치료를 요하는 부상을 입은 경우
제출물에 음수값이 존재할 경우 에러 발생
Public Score: 전체 테스트 데이터 중 30%
Private Score: 전체 테스트 데이터 중 70%

2. 평가

1차 평가: 리더보드 Private Score
2차 평가: Private Score 상위 10팀 코드 및 PPT 제출 후 코드 평가와 발표 평가
발표평가 기준:

3. 참여

개인 또는 팀을 이루어 참여할 수 있습니다.
단체 혹은 기관 참여시 별도의 절차가 필요합니다. (More > 공지사항> 게시글 확인)
개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능
팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
팀 최대 인원: 5명

* 동일인이 개인 또는 복수팀에 중복하여 등록 불가.

1일 제출 가능 횟수: 3회

4. 외부 데이터 및 사전 학습 모델

사용 가능한 외부데이터 채널
대구 빅데이터활용센터 (전체 데이터셋 활용을 위해서는 직접 대구 빅데이터활용센터 방문)
한국자동차연구원 자동차데이터 포털
공공데이터포털 (2023.11.20 추가)
단, 해당 출처 이외의 출처를 가지는 외부데이터는 사용 금지
대구 빅데이터활용센터에서 제공하는 전체 데이터셋을 활용하기 위해서는 직접 센터를 방문하여 사내망 사용
또한 2021.12.31 23:59:59 이후 구축된 데이터 역시 활용할 수 없음
이는 데이터(전체 데이터 파일이 아닌 파일 내부의 한 개의 행 단위) 자체가 생성된 시간을 기준으로 판단 (2023.11.30 15:34 설명추가)
사용에 법적 제한이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
참가자 본인이 외부 데이터로 사전 학습 모델을 추가 학습시켜 사용하는 것은 불가능

5. 코드 및 발표자료 제출 규칙

대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 코드 공유 게시판에 기한 내 제출
제출한 코드는 Private Score 복원이 가능해야 함

o 코드에 ‘/data’ 데이터 입/출력 경로 포함

o 코드 파일 확장자: .R, .rmd, .py, .ipynb

o 코드와 주석 인코딩: UTF-8

o 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o 개발 환경(OS) 및 라이브러리 버전 기재

발표 평가 PPT 자료

o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성

제출 파일 목록

o Private Score 복원이 가능한 코드 파일

o Private Score 복원이 가능한 모델 weight 파일

o 발표 평가 PPT 자료

o 외부데이터를 사용한 경우, 해당 외부데이터와 그 출처

코드와 PPT 모두 제출해야 수상이 가능합니다.

6. 유의 사항

1일 최대 제출 횟수: 3회
사용 가능 언어: Python, R
현재는 2021.12.31 23:59:59으로 설정됨
따라서, 2022.01.01 00:00:00부터 알 수 있는 특성을 활용하는 경우 Data Leakage로 실격 (리더보드 기록 삭제)
2022.01.01 00:00:00부터 발생한 모든 사건은 전혀 알 수 없다고 가정하여 진행해야함
Pseudo Labeling은 사용 불가
또한 2021.12.31 23:59:59 이후 구축된 데이터 역시 활용할 수 없음
이는 데이터(전체 데이터 파일이 아닌 파일 내부의 한 개의 행 단위) 자체가 생성된 시간을 기준으로 판단 (2023.11.30 15:34 설명추가)
Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음
모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
데이콘은 부정 제출 행위를 엄격히 금지하고 있으며, 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 링크를 참고해 주시기 바랍니다. https://dacon.io/notice/notice/13

7. 문의

대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해 주시기 바랍니다.
데이콘 답변을 희망하는 경우 [토크] 페이지 대회 문의 게시글에 댓글을 올려 주시기 바랍니다.

대회 주요 일정

11.15
대회 시작
12.04
팀 병합 마감
12.11
대회 종료
12.13
코드 및 PPT 제출
12.15
발표 평가

12.18
코드 평가
12.19
최종 수상자 발표
12.20
시상식

개요 규칙 일정 상금 동의사항