The 2nd Medical AI (MAI) Competition

Algorithm | Medical | Gene | Cosine Distance

  • moneyIcon Prize : 10,000,000 KRW
  • 249 Users D-24 to Close

1. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 팀을 이루어 참여하는 경우, 팀원 모두 참가 자격에 부합하는 상태여야합니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

2. 대회 규칙

  1) 사전 학습 모델 사용 가능 범위

  • 2025년 11월 10일 전(~2025.11.09)에 공식적으로 가중치가 공개되었으며, 최소한 비상업적 이용이 허용된 오픈소스 라이선스 (예: MIT, Apache 2.0 등)로 배포된 사전 학습 모델만 사용 가능합니다. 해당 조건을 충족하지 않는 모델은 사용할 수 없습니다.

2) API 사용 제한

  • 원격 서버를 통해서만 접근 가능한 API 형태의 모델(예: OpenAI API, Gemini API 등)은 사용이 불가능합니다. 모든 모델은 로컬 환경에서 직접 실행 가능해야 하며, 외부 서버에 의존하는 방식은 허용되지 않습니다.

3) 외부 데이터 사용 가능

  • 2025년 11월 10일 전(~2025.11.09)에 공식적으로 공개되었으며, 최소한 비상업적 이용이 허용된 라이선스(CC BY-NC, CC0, CC-BY-SA, CC-BY-NC-SA 등)로 배포된 외부 데이터만 사용할 수 있습니다. 해당 조건을 충족하지 않는 외부 데이터는 사용이 불가능합니다.
  • 직접 수집한 데이터(예: 수기 작성, 자체 크롤링)는 사용할 수 없습니다. 외부 데이터는 반드시 공식적으로 공개되어 있으며, 라이선스가 명확하게 부여된 경우에만 사용 가능합니다.
  • 데이터 증강은 허용되며, 코드 상 구현이 가능한 방식으로 사용해야 합니다. 단, 증강에 활용된 원천 데이터와 사용된 모델 역시 대회 규칙1), 2)을 충족해야 합니다.

🔹모든 외부 데이터는 출처, 사용 방식, 데이터 파일 등 증빙이 가능해야 하며, 이에 대한 확인이 이루어지지 않거나 라이센스가 저작권 침해 등 법적 문제가 있는 경우 실격 처리됩니다.

🔹모든 데이터 증강 과정은 관련 코드와 함께 제출되어야합니다.

4) 유전체 언어모델(gLM) 사용 및 제출 규칙

  • 유전체 언어모델(gLM)을 반드시 사용해야하며, 공개된 사전학습된 모델을 파인 튜닝(FineTuning)하여 사용할 수 있습니다. 새로운 gLM모델을 제안하는 것도 가능합니다.
  • 최대 2,048dimension, 512MB까지 제출 가능합니다. (*제출 시, 용량 및 인터넷 환경에 따라 최대 15분까지 소요될 수 있으며, 제출 중 페이지 새로고침 또는 이동을 하면 제출이 완료되지 않을 수 있으니 유의하시기 바랍니다.)
  • 다음의 제출 방식은 허용하지 않습니다.
  • 임베딩 벡터 자체를 임의 또는 무작위로 생성하여 제출하는 경우
  • 유전체 언어모델(gLM) 추론 결과를 후처리(Post-processing) 하는 경우 (ex. 앙상블/랜덤 노이즈 추가 등)


3. 코드 및 PPT 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 Private Score 복원이 가능해야 함
  • 코드에 ‘/data’ 데이터 입/출력 경로 포함
  • 코드 파일 확장자: .py, .ipynb
  • 코드와 주석 인코딩: UTF-8
  • 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
  • 개발 환경(OS) 및 라이브러리 버전 기재
  • 솔루션 PPT 자료 (15분 발표 분량)
  • 2차 평가 기준(평가 -> 2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성
  • 제출 파일 목록
  • Private Score 복원이 가능한 코드 파일
  • Private Score 복원이 가능한 모델 weight 파일
  • 외부 데이터에 대한 증빙 자료
  • 유전체 언어모델(gLM) 생성 코드
  • 솔루션 PPT 자료
  • [중요] 팀원 전체의 참가 자격을 증빙할 수 있는 재학증명서 또는 대체인증서류


4. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • 제출 파일의 최대 용량은 512MB이며, 초과되는 경우 제출이 불가능합니다.
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증과 발표 평가 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

5. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?


Main Event Schedule

  1. 10.02

    Start Date

  2. 10.31

    Team Merger Deadline

  3. 10.31

    Close

  4. Invalid Date

    Submission Deadline

1. 개인 또는 팀 참여 규칙

  • 개인 또는 팀을 이루어 참여할 수 있습니다.
  • 팀을 이루어 참여하는 경우, 팀원 모두 참가 자격에 부합하는 상태여야합니다.
  • 개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
  • 팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
  • 팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
  • 팀 최대 인원: 5 명
  • 동일인이 개인 또는 복수팀에 중복하여 등록 불가

  

2. 대회 규칙

  1) 사전 학습 모델 사용 가능 범위

  • 2025년 11월 10일 전(~2025.11.09)에 공식적으로 가중치가 공개되었으며, 최소한 비상업적 이용이 허용된 오픈소스 라이선스 (예: MIT, Apache 2.0 등)로 배포된 사전 학습 모델만 사용 가능합니다. 해당 조건을 충족하지 않는 모델은 사용할 수 없습니다.

2) API 사용 제한

  • 원격 서버를 통해서만 접근 가능한 API 형태의 모델(예: OpenAI API, Gemini API 등)은 사용이 불가능합니다. 모든 모델은 로컬 환경에서 직접 실행 가능해야 하며, 외부 서버에 의존하는 방식은 허용되지 않습니다.

3) 외부 데이터 사용 가능

  • 2025년 11월 10일 전(~2025.11.09)에 공식적으로 공개되었으며, 최소한 비상업적 이용이 허용된 라이선스(CC BY-NC, CC0, CC-BY-SA, CC-BY-NC-SA 등)로 배포된 외부 데이터만 사용할 수 있습니다. 해당 조건을 충족하지 않는 외부 데이터는 사용이 불가능합니다.
  • 직접 수집한 데이터(예: 수기 작성, 자체 크롤링)는 사용할 수 없습니다. 외부 데이터는 반드시 공식적으로 공개되어 있으며, 라이선스가 명확하게 부여된 경우에만 사용 가능합니다.
  • 데이터 증강은 허용되며, 코드 상 구현이 가능한 방식으로 사용해야 합니다. 단, 증강에 활용된 원천 데이터와 사용된 모델 역시 대회 규칙1), 2)을 충족해야 합니다.

🔹모든 외부 데이터는 출처, 사용 방식, 데이터 파일 등 증빙이 가능해야 하며, 이에 대한 확인이 이루어지지 않거나 라이센스가 저작권 침해 등 법적 문제가 있는 경우 실격 처리됩니다.

🔹모든 데이터 증강 과정은 관련 코드와 함께 제출되어야합니다.

4) 유전체 언어모델(gLM) 사용 및 제출 규칙

  • 유전체 언어모델(gLM)을 반드시 사용해야하며, 공개된 사전학습된 모델을 파인 튜닝(FineTuning)하여 사용할 수 있습니다. 새로운 gLM모델을 제안하는 것도 가능합니다.
  • 최대 2,048dimension, 512MB까지 제출 가능합니다. (*제출 시, 용량 및 인터넷 환경에 따라 최대 15분까지 소요될 수 있으며, 제출 중 페이지 새로고침 또는 이동을 하면 제출이 완료되지 않을 수 있으니 유의하시기 바랍니다.)
  • 다음의 제출 방식은 허용하지 않습니다.
  • 임베딩 벡터 자체를 임의 또는 무작위로 생성하여 제출하는 경우
  • 유전체 언어모델(gLM) 추론 결과를 후처리(Post-processing) 하는 경우 (ex. 앙상블/랜덤 노이즈 추가 등)


3. 코드 및 PPT 제출 규칙

  • 대회 종료 후 2차 평가 대상자는 아래의 양식에 맞추어 코드와 PPT를 dacon@dacon.io 메일로 기한 내에 제출
  • 제출한 코드는 Private Score 복원이 가능해야 함
  • 코드에 ‘/data’ 데이터 입/출력 경로 포함
  • 코드 파일 확장자: .py, .ipynb
  • 코드와 주석 인코딩: UTF-8
  • 모든 코드는 오류 없이 실행되어야 함(라이브러리 로딩 코드 포함)
  • 개발 환경(OS) 및 라이브러리 버전 기재
  • 솔루션 PPT 자료 (15분 발표 분량)
  • 2차 평가 기준(평가 -> 2. 평가 방식 -> 2차 평가 기준)에 맞춰 자유 양식으로 작성
  • 제출 파일 목록
  • Private Score 복원이 가능한 코드 파일
  • Private Score 복원이 가능한 모델 weight 파일
  • 외부 데이터에 대한 증빙 자료
  • 유전체 언어모델(gLM) 생성 코드
  • 솔루션 PPT 자료
  • [중요] 팀원 전체의 참가 자격을 증빙할 수 있는 재학증명서 또는 대체인증서류


4. 유의 사항

  • 1일 최대 제출 횟수: 3회
  • 사용 가능 언어: Python
  • 모든 csv 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.
  • 제출 파일의 최대 용량은 512MB이며, 초과되는 경우 제출이 불가능합니다.
  • 모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
  • 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점 받고 싶은 파일 1개를 선택해야 함
  • 대회 직후 공개되는 Private 랭킹은 최종 순위가 아니며 코드 검증과 발표 평가 후 수상자가 결정됨
  • 데이콘은 부정 제출 행위를 금지하고 있으며 데이콘 대회 부정 제출 이력이 있는 경우 평가가 제한됩니다. 자세한 사항은 아래의 링크를 참고해 주시기 바랍니다.

https://dacon.io/notice/notice/13

 

5. 토론(질문)

  • 대회 운영 및 데이터 이상에 관련된 질문 외에는 답변을 드리지 않고 있습니다. 기타 질문은 토론 페이지를 통해 자유롭게 토론해주시기 바랍니다.
  • 데이콘 답변을 희망하는 경우 토크 게시글 댓글로 질문을 올려 주시기 바랍니다.

예) [DACON 답변 요청] 시상식은 언제 열리나요?


Main Event Schedule

  1. 10.02

    Start Date
  2. 10.31

    Team Merger Deadline
  3. 10.31

    Close
  4. Invalid Date

    Submission Deadline