2026 SKKU Multimodal AI Bias Challenge

Algorithm | Multimodal | LLM | Vision | Generated AI | Bias | QA | Accuracy

7,200,000 KRW
529 Users Completed

Practice

Overview Data Code (share) Talk newIcon

Leaderboard

Submission

[대회규칙 및 유의사항]

1. 참여

개인 또는 팀을 이루어 참여할 수 있습니다.
개인 참가 방법 : 팀 신청 없이, 자유롭게 제출탭에서 제출 가능
팀 참가 방법 : 팀 탭에서 가능, 상세 내용은 팀 탭에서 팀 병합 정책 확인
팀 구성 방법: 팀 페이지에서 팀 구성 안내 확인
팀 최대 인원: 5 명
동일인이 개인 또는 복수팀에 중복하여 등록 불가

2. 사용 가능 언어

- Python

3. 외부 데이터 관련 규칙

- 법적 제약이 없는 범위 내에서 외부 데이터 사용이 가능합니다.

- 외부 데이터 사용 시 저작권, 라이선스, 개인정보, 데이터 이용 조건 등을 반드시 준수해야 합니다.

- 공개 데이터, 자체 수집 데이터, 합성 데이터 및 생성형 AI로 생성한 데이터는 사용할 수 있습니다.

- 단, 평가 데이터셋을 원천으로 유사한 문항, 지문, 선택지, 학습 데이터 등을 생성하거나 재구성하는 행위는 허용되지 않습니다.

- 평가 데이터셋의 정답 또는 이에 준하는 정보를 추론·활용하는 행위는 규칙 위반에 해당합니다.

※ 외부 데이터 사용 과정에서 법적·윤리적 문제가 발생하거나, 대회 규칙을 위반한 사실이 확인되는 경우 수상이 제한될 수 있습니다.

4. 사전 학습모델 사용 규칙

- 2026년 6월 1일 전(~2026.05.31)에 공식적으로 가중치가 공개된 오픈소스 모델만 사용할 수 있습니다.

- 해당 조건을 충족하지 않는 모델은 사용할 수 없습니다.

- 사용한 모델, 가중치, 라이선스, 다운로드 경로 등은 추후 코드 검증 및 2차 평가 과정에서 확인될 수 있습니다.

5. API 기반 모델 사용 제한

- OpenAI API, Gemini API, Hugging Face Inference API, Together AI, OpenRouter 등 원격 서버를 통해 모델 응답을 받는 API 기반 모델 사용은 불가능합니다.

- 외부 API를 통한 모델 추론은 금지되며, 참가자가 직접 관리하는 PC·클라우드 서버·연구실 서버 등에서 모델 가중치를 직접 로드하여 실행하는 방식만 허용됩니다.

6. LLM 기반 최종 답변 생성 요건

- 최종 답변은 생성형 언어모델(LLM)에 의해 생성된 텍스트여야 합니다.

- 단순 룰 기반 출력, 조건문 기반 매핑, 사전 정의된 정답 목록에서의 선택만으로 구성된 응답은 허용되지 않습니다.

- 모델 입력 전처리, 프롬프트 구성, 모델 추론, 최종 출력 생성 과정은 추후 제출 코드로 재현 가능해야 합니다.

모델 앙상블, 다중 프롬프트, 후보 답변 생성 및 검토 전략은 사용할 수 있습니다.

다만 앙상블 적용 시 최종 제출 답변은 LLM이 후보 답변, 근거, 검토 결과 등을 종합하여 생성한 결과여야 합니다.

단순 다수결, 평균, 조건문, 룰 기반 매핑 또는 사전 정의된 정답 목록에서의 선택만으로 최종 답변을 결정하는 방식은 허용되지 않습니다.

7. 추론 코드 및 실행 환경 규칙

- 참가자는 자유로운 환경에서 모델 및 추론 코드를 개발할 수 있습니다.

- 단, 최종 추론 코드는 운영진이 안내한 기준 평가 환경에서 정상적으로 실행 가능해야 합니다.

- 추론 시간은 샘플당 평균 0.5초 이내를 권장하며, 이에 따른 참고 기준은 아래와 같습니다.

Test 평가셋 8,500개 기준: 약 70분 이내
Hidden 평가셋 1,500개 기준: 약 13분 이내

- 위 기준은 과도하게 무거운 모델을 제한하기 위한 참고 기준이며, 더 빠른 추론 시간에 대한 별도 가산점은 없습니다.

- 추론 시간 및 실행 가능 여부는 운영진 기준 평가 환경에서 최종 확인합니다.

- 추론 코드는 데이터 전처리, 모델 로드, 추론, 최종 출력 생성 과정을 포함해야 하며, 오프라인 환경에서 외부 API 호출 또는 인터넷 통신은 허용되지 않습니다.

※ 기준 평가 환경: RTX A6000 48GB, Python 3.10, CUDA 12.4, PyTorch 2.6.0, Ubuntu 20.04

8. 유의 사항

- 1일 최대 제출 횟수: 5회

- 모든 CSV 형식의 데이터와 제출 파일은 UTF-8 인코딩을 적용합니다.

- 평가 데이터셋은 제출 결과 생성을 위한 추론 목적으로만 사용할 수 있습니다.

- 평가 데이터셋의 질문 유형, 선택지 패턴, 문항 구성, 표현 방식 등을 분석하여 이와 유사한 학습 데이터, 예시 지문, 프롬프트, 규칙 등을 의도적으로 생성·활용하는 행위는 Data Leakage로 간주되며 수상이 제한될 수 있습니다.

- 최종 순위는 선택된 파일 중에서 채점되므로 참가자는 제출 창에서 자신이 최종적으로 채점받고 싶은 파일 1개를 선택해야 합니다.

- 대회 종료 후 공개되는 Private 랭킹은 최종 순위가 아니며, 코드 검증 및 2차 평가 후 수상자가 결정됩니다.

- 본 대회는 참가팀의 부정 행위를 금지하고 있습니다. 부정 행위가 발견되는 경우, 해당 팀에 대해 평가가 진행되지 않습니다.

- 대회 기간 중 규칙 위반 의심 정황이 발견되는 경우 주최측에서 해당 팀에게 소명 및 코드를 요청할 수 있습니다.

※ 부정 행위 : 대회 규칙을 준수하지 않은 모든 행위

Main Event Schedule

05.20
Start Date
06.20
Team Merger Deadline
06.20
Close
Invalid Date
Submission Deadline

Description Evaluation Rules Schedule Prize Agreement