난독화된 한글 리뷰 복원 AI 경진대회

알고리즘 | 월간 데이콘 | NLP | LLM | F1 Score

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 202명 D-50

1. 리더보드

  • 평가 산식 : 문자 단위의 F1 Score

  • Public Score : 전체 테스트 데이터 중 사전 샘플링된 50%
  • Private Score : 전체 테스트 데이터 100%



2. 평가

  • 1차 평가: 리더보드 Private Score
  • 2차 평가: Private Score 상위 10팀 코드 및 PPT 제출 후 코드 검증


3. 참여

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 단체 혹은 기관 참여시 별도의 절차가 필요합니다. (More > 공지사항> 게시글 확인)
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5 명

                   * 동일인이 개인 또는 복수팀에 중복하여 등록 불가.

  • 1일 제출 가능 횟수: 10회
  • 대회 기간 제출 내 제출 허용 횟수 : 500회

 

4. 외부 데이터 및 API / 사전 학습 모델

  • 외부 데이터 사용 금지: 경진대회 제공 데이터 외에는 사용할 수 없습니다.
  • 학습 데이터 증강 가능: 제공된 훈련 데이터를 증강할 수 있지만, ChatGPT, Claude 등과 같은 모델의 코드와 가중치 파일이 공개되지 않은 LLM(또는 사전 학습 모델)은 사용할 수 없습니다. 이는 증강 뿐만 아니라 데이터 전처리에도 동일한 규칙이 적용됩니다.
  • 공식 공개 사전 학습 모델 사용 가능: 가중치 파일이 공식적으로 공개되고 사용에 법적 제약이 없는 사전 학습 모델은 사용할 수 있습니다.
  • 유료 LLM 모델 API 사용 금지: 유료 LLM 모델의 API를 이용한 모델 학습 및 추론은 금지됩니다. (데이터 조작 포함)


5. 코드 및 PPT 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 [코드 공유 게시판]에 기한 내 제출
  • 코드
  • 코드에 ‘/data’ 데이터 입/출력 경로 포함
  • 코드 파일 확장자: .R, .rmd, .py, .ipynb
  • 코드와 주석 인코딩: UTF-8
  • 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
  • 개발 환경(OS) 및 라이브러리 버전 기재
  • 사전 학습 모델 사용 시 출처와 (별도 필요시) 다운로드 링크
  • 제출한 코드는 Private Score 복원이 가능해야 함
  • 솔루션 설명 PPT 자료
  • 자유 양식
  • 코드와 PPT 자료 모두 기한 내 제출해야 수상이 가능합니다.


6. 유의 사항

  • 1일 최대 제출 횟수: 10회, 대회 기간 내 최대 500회
  • 사용 가능 언어: Python
  • 대회 기간 내 팀 외의 모든 인사이트 및 코드 공유는 데이콘 플랫폼 내에서 공개적으로만 이루어져야하며 이 밖의 모든 비공식적인 공유 행위는 Private Sharing으로 간주합니다.
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 엄격히 금지하고 있으며, 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다.
  • 자세한 사항은 링크를 참고해 주시기 바랍니다.


7. 문의

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해 주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 [토크] 페이지 대회 문의 게시글에 댓글을 올려 주시기 바랍니다.


대회 주요 일정

  1. 01.06

    대회 시작

  2. 02.21

    팀 병합 마감

  3. 02.28

    대회 종료

  4. 03.05

    코드 및 PPT 제출 마감

  5. 03.14

    코드 검증

  6. 03.17

    최종 수상자 발표

1. 리더보드

  • 평가 산식 : 문자 단위의 F1 Score

  • Public Score : 전체 테스트 데이터 중 사전 샘플링된 50%
  • Private Score : 전체 테스트 데이터 100%



2. 평가

  • 1차 평가: 리더보드 Private Score
  • 2차 평가: Private Score 상위 10팀 코드 및 PPT 제출 후 코드 검증


3. 참여

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 단체 혹은 기관 참여시 별도의 절차가 필요합니다. (More > 공지사항> 게시글 확인)
  • 개인 참가 방법: 팀 신청 없이, 자유롭게 제출 창에서 제출 가능
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5 명

                   * 동일인이 개인 또는 복수팀에 중복하여 등록 불가.

  • 1일 제출 가능 횟수: 10회
  • 대회 기간 제출 내 제출 허용 횟수 : 500회

 

4. 외부 데이터 및 API / 사전 학습 모델

  • 외부 데이터 사용 금지: 경진대회 제공 데이터 외에는 사용할 수 없습니다.
  • 학습 데이터 증강 가능: 제공된 훈련 데이터를 증강할 수 있지만, ChatGPT, Claude 등과 같은 모델의 코드와 가중치 파일이 공개되지 않은 LLM(또는 사전 학습 모델)은 사용할 수 없습니다. 이는 증강 뿐만 아니라 데이터 전처리에도 동일한 규칙이 적용됩니다.
  • 공식 공개 사전 학습 모델 사용 가능: 가중치 파일이 공식적으로 공개되고 사용에 법적 제약이 없는 사전 학습 모델은 사용할 수 있습니다.
  • 유료 LLM 모델 API 사용 금지: 유료 LLM 모델의 API를 이용한 모델 학습 및 추론은 금지됩니다. (데이터 조작 포함)


5. 코드 및 PPT 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 [코드 공유 게시판]에 기한 내 제출
  • 코드
  • 코드에 ‘/data’ 데이터 입/출력 경로 포함
  • 코드 파일 확장자: .R, .rmd, .py, .ipynb
  • 코드와 주석 인코딩: UTF-8
  • 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
  • 개발 환경(OS) 및 라이브러리 버전 기재
  • 사전 학습 모델 사용 시 출처와 (별도 필요시) 다운로드 링크
  • 제출한 코드는 Private Score 복원이 가능해야 함
  • 솔루션 설명 PPT 자료
  • 자유 양식
  • 코드와 PPT 자료 모두 기한 내 제출해야 수상이 가능합니다.


6. 유의 사항

  • 1일 최대 제출 횟수: 10회, 대회 기간 내 최대 500회
  • 사용 가능 언어: Python
  • 대회 기간 내 팀 외의 모든 인사이트 및 코드 공유는 데이콘 플랫폼 내에서 공개적으로만 이루어져야하며 이 밖의 모든 비공식적인 공유 행위는 Private Sharing으로 간주합니다.
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 엄격히 금지하고 있으며, 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다.
  • 자세한 사항은 링크를 참고해 주시기 바랍니다.


7. 문의

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해 주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 [토크] 페이지 대회 문의 게시글에 댓글을 올려 주시기 바랍니다.


대회 주요 일정

  1. 01.06

    대회 시작
  2. 02.21

    팀 병합 마감
  3. 02.28

    대회 종료
  4. 03.05

    코드 및 PPT 제출 마감
  5. 03.14

    코드 검증
  6. 03.17

    최종 수상자 발표