1. 리더 보드
- 평가 산식 : Accuracy
- Public score : 전체 테스트 데이터 중 30%
- Private score : 전체 테스트 데이터 중 나머지 70%
2. 평가 방식
- 1차 평가 : 리더보드 Private Score
- 동점자의 경우, 기존 리더보드 순위 산정 방식을 따름 [링크]의 '리더보드 점수' 부분을 참고
- 2차 평가 : 코드 및 PPT 제출 후 Private 상위 5팀 온라인 발표 평가
- 2차 평가 기준 (23.02.01 수정)

3. 개인 또는 팀 참여 규칙
- 예선에서 결성한 팀 혹은 개인으로 본선에 참여합니다.
- 본선 기간 동안에는 추가 팀 결성 및 변경 불가능
4. 외부 데이터 및 사전 학습 모델
- 외부 데이터 모델 학습 사용 금지 (본선 경진대회 제공 학습데이터만 모델 학습에 사용 가능)
- 전처리/Augmentation 단계에서 단어, 어휘 확보를 위한 외부 Vocabulary는 활용 가능
- 단 출처가 명확해야 하며 직접 뉴스 기사 등의 텍스트 크롤링은 불가능
- 모델 학습이 불가능한 Text Recognition API는 사용 불가능
- 사용에 법적 제약이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
- 참가자 본인이 외부 데이터로 사전 학습 모델을 추가 학습시켜 사용하는 것은 불가능
- 사전 학습 모델의 출처와 논문 링크 필수 기재
- 확인이 어려운 경우 dacon@dacon.io로 문의
5. 코드 및 PPT 제출 규칙
- 아래의 양식에 맞추어 코드를 dacon@dacon.io로 기한 내에 제출
o 코드에 ‘/data’ 데이터 입/출력 경로 포함
o 코드 파일 확장자: .R, .rmd, .py, .ipynb
o 코드와 주석 인코딩: UTF-8
o 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
o 전체 프로세스를 가독성 있게 정리하고 주석을 포함하여 하나의 파일로 제출
o 개발 환경(OS) 및 라이브러리 버전 기재
o 추론에 사용된 모델 파일 (pth 등) 다운로드 링크 혹은 메일 첨부
o 사용한 사전 학습 모델의 논문 링크, 출처를 기재
o (선택) docker 제출 시, dockerfile 파일과 코드 파일들을 포함한 tar 형태로 압축한 파일로 제출
o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성
o 각 팀원의 역할 명시
o 발표 시간 10분 분량으로 준비
6. 유의 사항
- 1일 최대 제출 횟수: 3 회
- 사용 가능 언어: Python, R
- 제공된 경진대회 학습 데이터로부터 모델 학습의 과정이 필수로 존재해야합니다.
- 전처리 과정과 모델 학습에서 평가 데이터셋 정보 활용(Data Leakage)시 수상 불가능
- 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
- 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일을 2개를 선택해야 함
- 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 최종 수상자가 결정됨
- 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.
https://dacon.io/notice/notice/13
7. 토론(질문)
- 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
- 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.
예) [DACON 답변 요청] 시상식은 언제 열리나요?