난독화된 한글 리뷰 복원 및 생성 AI 경진대회

알고리즘 | 월간 데이콘 | NLP | 생성형 AI | LLM | F1 Score

상금 : 데이스쿨 프로 구독권
2025.01.06 ~ 2025.02.28 09:59 + Google Calendar
728명 마감

대회안내 데이터 코드 공유 토크 리더보드

제출

1. 리더보드

평가 산식 : 문자 단위의 F1 Score

Public Score : 전체 테스트 데이터 중 사전 샘플링된 50%
Private Score : 전체 테스트 데이터 100%

2. 평가

1차 평가: 리더보드 Private Score
2차 평가: Private Score 상위 10팀 코드 및 PPT 제출 후 코드 검증

3. 참여

개인 또는 팀을 이루어 참여할 수 있습니다.
단체 혹은 기관 참여시 별도의 절차가 필요합니다. (More > 공지사항> 게시글 확인)
개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능
팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
팀 최대 인원: 5 명

* 동일인이 개인 또는 복수팀에 중복하여 등록 불가.

1일 제출 가능 횟수: 10회
대회 기간 제출 내 제출 허용 횟수 : 500회

4. 외부 데이터 및 API / 사전 학습 모델

외부 데이터 사용 금지: 경진대회 제공 데이터 외에는 사용할 수 없습니다.
학습 데이터 증강 가능: 제공된 훈련 데이터를 증강할 수 있지만, ChatGPT, Claude 등과 같은 모델의 코드와 가중치 파일이 공개되지 않은 LLM(또는 사전 학습 모델)은 사용할 수 없습니다. 이는 증강 뿐만 아니라 데이터 전처리에도 동일한 규칙이 적용됩니다.
공식 공개 사전 학습 모델 사용 가능: 가중치 파일이 공식적으로 공개되고 사용에 법적 제약이 없는 사전 학습 모델은 사용할 수 있습니다.
유료 LLM 모델 API 사용 금지: 유료 LLM 모델의 API를 이용한 모델 학습 및 추론은 금지됩니다. (데이터 조작 포함)

5. 코드 및 PPT 제출 규칙

대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 [코드 공유 게시판]에 기한 내 제출
코드
코드에 ‘/data’ 데이터 입/출력 경로 포함
코드 파일 확장자: .R, .rmd, .py, .ipynb
코드와 주석 인코딩: UTF-8
모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
개발 환경(OS) 및 라이브러리 버전 기재
사전 학습 모델 사용 시 출처와 (별도 필요시) 다운로드 링크
제출한 코드는 Private Score 복원이 가능해야 함
솔루션 설명 PPT 자료
자유 양식
코드와 PPT 자료 모두 기한 내 제출해야 수상이 가능합니다.

6. 유의 사항

1일 최대 제출 횟수: 10회, 대회 기간 내 최대 500회
사용 가능 언어: Python
대회 기간 내 팀 외의 모든 인사이트 및 코드 공유는 데이콘 플랫폼 내에서 공개적으로만 이루어져야하며 이 밖의 모든 비공식적인 공유 행위는 Private Sharing으로 간주합니다.
대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
데이콘은 부정 제출 행위를 엄격히 금지하고 있으며, 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다.
자세한 사항은 링크를 참고해 주시기 바랍니다.

7. 문의

대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해 주시기 바랍니다.
데이콘 답변을 희망하는 경우 [토크] 페이지 대회 문의 게시글에 댓글을 올려 주시기 바랍니다.

대회 주요 일정

01.06
대회 시작
02.21
팀 병합 마감
02.28
대회 종료
03.05
코드 및 PPT 제출 마감
03.14
코드 검증
03.17
최종 수상자 발표

개요 규칙 일정 상금 동의사항

1. 리더보드

평가 산식 : 문자 단위의 F1 Score

Public Score : 전체 테스트 데이터 중 사전 샘플링된 50%
Private Score : 전체 테스트 데이터 100%

2. 평가

1차 평가: 리더보드 Private Score
2차 평가: Private Score 상위 10팀 코드 및 PPT 제출 후 코드 검증

3. 참여

개인 또는 팀을 이루어 참여할 수 있습니다.
단체 혹은 기관 참여시 별도의 절차가 필요합니다. (More > 공지사항> 게시글 확인)
개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능
팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
팀 최대 인원: 5 명

* 동일인이 개인 또는 복수팀에 중복하여 등록 불가.

1일 제출 가능 횟수: 10회
대회 기간 제출 내 제출 허용 횟수 : 500회

4. 외부 데이터 및 API / 사전 학습 모델

외부 데이터 사용 금지: 경진대회 제공 데이터 외에는 사용할 수 없습니다.
학습 데이터 증강 가능: 제공된 훈련 데이터를 증강할 수 있지만, ChatGPT, Claude 등과 같은 모델의 코드와 가중치 파일이 공개되지 않은 LLM(또는 사전 학습 모델)은 사용할 수 없습니다. 이는 증강 뿐만 아니라 데이터 전처리에도 동일한 규칙이 적용됩니다.
공식 공개 사전 학습 모델 사용 가능: 가중치 파일이 공식적으로 공개되고 사용에 법적 제약이 없는 사전 학습 모델은 사용할 수 있습니다.
유료 LLM 모델 API 사용 금지: 유료 LLM 모델의 API를 이용한 모델 학습 및 추론은 금지됩니다. (데이터 조작 포함)

5. 코드 및 PPT 제출 규칙

대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 [코드 공유 게시판]에 기한 내 제출
코드
코드에 ‘/data’ 데이터 입/출력 경로 포함
코드 파일 확장자: .R, .rmd, .py, .ipynb
코드와 주석 인코딩: UTF-8
모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
개발 환경(OS) 및 라이브러리 버전 기재
사전 학습 모델 사용 시 출처와 (별도 필요시) 다운로드 링크
제출한 코드는 Private Score 복원이 가능해야 함
솔루션 설명 PPT 자료
자유 양식
코드와 PPT 자료 모두 기한 내 제출해야 수상이 가능합니다.

6. 유의 사항

1일 최대 제출 횟수: 10회, 대회 기간 내 최대 500회
사용 가능 언어: Python
대회 기간 내 팀 외의 모든 인사이트 및 코드 공유는 데이콘 플랫폼 내에서 공개적으로만 이루어져야하며 이 밖의 모든 비공식적인 공유 행위는 Private Sharing으로 간주합니다.
대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
데이콘은 부정 제출 행위를 엄격히 금지하고 있으며, 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다.
자세한 사항은 링크를 참고해 주시기 바랍니다.

7. 문의

대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해 주시기 바랍니다.
데이콘 답변을 희망하는 경우 [토크] 페이지 대회 문의 게시글에 댓글을 올려 주시기 바랍니다.

대회 주요 일정

01.06
대회 시작
02.21
팀 병합 마감
02.28
대회 종료
03.05
코드 및 PPT 제출 마감
03.14
코드 검증
03.17
최종 수상자 발표