Jump AI 2025 : 제 3회 AI 신약개발 경진대회

알고리즘 | 분자 구조 | 정형 | 회귀 | 바이오

1. 리더보드

  • 평가 산식
  • A = IC50(nM) 단위의 Normalized RMSE 오차, 예측 정확도 측정

  • B = pIC50 변환값을 기준으로 한 예측값과 실제값 간의 선형 상관관계의 제곱

  • Score = 0.4 x (1 - min(A, 1)) + 0.6 x B

  • Public score : 전체 테스트 데이터 중 사전 샘플링된 40%
  • Private score : 전체 테스트 데이터 중 나머지 60%


2. 평가 방식

  • 1차 평가 : 리더보드 Private Score
  • 2차 평가 : Private Score 상위 10팀 코드 및 PPT 제출 후 코드 검증 및 온라인 발표 평가
  • 2차 평가 기준

※ 평가 기준은 대회 운영 상황에 따라 변경될 수 있습니다.


3. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

4. 대회 규칙

1) 사전 학습 모델 사용 가능 범위

  • 2025년 7월 7일 전(~2025.07.06)에 공식적으로 가중치가 공개되었으며, 최소 비상업적 이용이 허용된 오픈소스 라이선스 (예:MIT,Apache 2.0 등)로 배포된 사전학습 모델 및 가중치만 사용 가능합니다.
  • 해당 조건을 충족하지 않는 모델과 가중치는 사용할 수 없습니다.

2) API 사용 제한

  • 원격 서버를 통해서만 접근 가능한 API 형태의 모델(예:OpenAI API, Gemini API 등)은 사용이 불가능합니다.
  • 모든 모델은 로컬 환경에서 직접 실행이 가능해야하며, 외부 서버에 의존하는 방식은 허용되지 않습니다.

3) 외부 데이터 사용 허용 범위

  • 외부 데이터 사용을 허용합니다.
  • 2025년 7월 7일 전(~2025.07.06)에 공식적으로 공개되었으며, 최소한 비상업적 이용이 허용된 라이선스(CC BY-NC, CC0 등)로 배포된 외부 데이터만 사용할 수 있습니다. 해당 조건을 충족하지 않는 외부 데이터는 사용이 불가능합니다.
  • 모든 외부 데이터는 출처, 사용 방식, 데이터 파일 등 증빙이 가능해야 하며, 이에 대한 확인이 이루어지지 않을 경우 실격 처리될 수 있습니다.

4) 외부 도구 및 소프트웨어 사용 범위

  • 외부 도구 및 소프트웨어는 최소 비상업적 이용이 허용된 오픈소스 라이선스(예:MIT,Apache 2.0 등) 하에 배포된 것만 사용 가능합니다.
  • 해당 조건을 충족하지 않는 도구 및 소프트웨어는 사용할 수 없습니다.

5) 출처 명시 의무

  • 코드 제출 시, 본 규정에 따라 사용된 모든 사전 학습 모델, 외부 데이터, 외부 도구 및 소프트웨어에 대한 각각의 출처(예:URL, 원본 논문명, 데이터셋 명칭, 라이선스 정보 등)를 명확하게 기술하여 함께 제출해야 합니다.


5. 코드 및 PPT 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 규칙을 준수하고 Private Score 복원이 가능해야 코드 검증 과정을 통과할 수 있습니다.

[제출 코드 관련]

o  코드에 데이터 입/출력 경로를 상대 경로로 표기

o  코드와 주석 인코딩: UTF-8

o  모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o  개발 환경(OS) 및 라이브러리 버전 기재

o 추론(Inference) 과정은 별도의 코드로 작성해야 하며, 추론에 활용하는 모델 가중치(Weight) 파일을 필수로 포함

[발표자료 관련]

o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 10분 PT 분량의 자유 양식으로 작성

o 기술적 오류 방지를 위해 PPT는 허용되지 않음

[제출 파일 목록]

o Private Score 복원이 가능한 코드 파일 (학습/추론)

o Private Score 복원이 가능한 모델 가중치(Weight) 파일

o 발표 자료

o 외부데이터를 사용한 경우, 해당 외부데이터와 그 출처


6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • 모델 학습과 추론에서 평가 데이터셋 정보 활용(Data Leakage)시 수상 제외
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증과 발표 평가 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?



대회 주요 일정

  1. 07.07

    대회 시작

  2. 08.18

    팀 병합 마감

  3. 08.25

    대회 종료

  4. 09.05

    코드 및 발표자료 제출 마감

  5. 09.12

    코드 검증 마감

  1. 09.16

    온라인 발표평가

  2. 09.18

    최종 수상자 발표

  3. 09.25

    오프라인 시상식

1. 리더보드

  • 평가 산식
  • A = IC50(nM) 단위의 Normalized RMSE 오차, 예측 정확도 측정

  • B = pIC50 변환값을 기준으로 한 예측값과 실제값 간의 선형 상관관계의 제곱

  • Score = 0.4 x (1 - min(A, 1)) + 0.6 x B

  • Public score : 전체 테스트 데이터 중 사전 샘플링된 40%
  • Private score : 전체 테스트 데이터 중 나머지 60%


2. 평가 방식

  • 1차 평가 : 리더보드 Private Score
  • 2차 평가 : Private Score 상위 10팀 코드 및 PPT 제출 후 코드 검증 및 온라인 발표 평가
  • 2차 평가 기준

※ 평가 기준은 대회 운영 상황에 따라 변경될 수 있습니다.


3. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

4. 대회 규칙

1) 사전 학습 모델 사용 가능 범위

  • 2025년 7월 7일 전(~2025.07.06)에 공식적으로 가중치가 공개되었으며, 최소 비상업적 이용이 허용된 오픈소스 라이선스 (예:MIT,Apache 2.0 등)로 배포된 사전학습 모델 및 가중치만 사용 가능합니다.
  • 해당 조건을 충족하지 않는 모델과 가중치는 사용할 수 없습니다.

2) API 사용 제한

  • 원격 서버를 통해서만 접근 가능한 API 형태의 모델(예:OpenAI API, Gemini API 등)은 사용이 불가능합니다.
  • 모든 모델은 로컬 환경에서 직접 실행이 가능해야하며, 외부 서버에 의존하는 방식은 허용되지 않습니다.

3) 외부 데이터 사용 허용 범위

  • 외부 데이터 사용을 허용합니다.
  • 2025년 7월 7일 전(~2025.07.06)에 공식적으로 공개되었으며, 최소한 비상업적 이용이 허용된 라이선스(CC BY-NC, CC0 등)로 배포된 외부 데이터만 사용할 수 있습니다. 해당 조건을 충족하지 않는 외부 데이터는 사용이 불가능합니다.
  • 모든 외부 데이터는 출처, 사용 방식, 데이터 파일 등 증빙이 가능해야 하며, 이에 대한 확인이 이루어지지 않을 경우 실격 처리될 수 있습니다.

4) 외부 도구 및 소프트웨어 사용 범위

  • 외부 도구 및 소프트웨어는 최소 비상업적 이용이 허용된 오픈소스 라이선스(예:MIT,Apache 2.0 등) 하에 배포된 것만 사용 가능합니다.
  • 해당 조건을 충족하지 않는 도구 및 소프트웨어는 사용할 수 없습니다.

5) 출처 명시 의무

  • 코드 제출 시, 본 규정에 따라 사용된 모든 사전 학습 모델, 외부 데이터, 외부 도구 및 소프트웨어에 대한 각각의 출처(예:URL, 원본 논문명, 데이터셋 명칭, 라이선스 정보 등)를 명확하게 기술하여 함께 제출해야 합니다.


5. 코드 및 PPT 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 규칙을 준수하고 Private Score 복원이 가능해야 코드 검증 과정을 통과할 수 있습니다.

[제출 코드 관련]

o  코드에 데이터 입/출력 경로를 상대 경로로 표기

o  코드와 주석 인코딩: UTF-8

o  모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)

o  개발 환경(OS) 및 라이브러리 버전 기재

o 추론(Inference) 과정은 별도의 코드로 작성해야 하며, 추론에 활용하는 모델 가중치(Weight) 파일을 필수로 포함

[발표자료 관련]

o 2차 평가 기준(2. 평가 방식 -> 2차 평가 기준)에 맞춰 10분 PT 분량의 자유 양식으로 작성

o 기술적 오류 방지를 위해 PPT는 허용되지 않음

[제출 파일 목록]

o Private Score 복원이 가능한 코드 파일 (학습/추론)

o Private Score 복원이 가능한 모델 가중치(Weight) 파일

o 발표 자료

o 외부데이터를 사용한 경우, 해당 외부데이터와 그 출처


6. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python, R
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • 모델 학습과 추론에서 평가 데이터셋 정보 활용(Data Leakage)시 수상 제외
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증과 발표 평가 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

7. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?



대회 주요 일정

  1. 07.07

    대회 시작
  2. 08.18

    팀 병합 마감
  3. 08.25

    대회 종료
  4. 09.05

    코드 및 발표자료 제출 마감
  5. 09.12

    코드 검증 마감
  6. 09.16

    온라인 발표평가
  7. 09.18

    최종 수상자 발표
  8. 09.25

    오프라인 시상식