2026 SKKU Multimodal AI Challenge

Algorithm | Multimodal | LLM | Vision | Generated AI | Bias | QA | Accuracy

  • moneyIcon 7,200,000 KRW
  • 99 Users D-28 to Close

Description

[배포용 데이터 구조]

open.zip

├── train/

│   ├── images/

│   │  └── train_img_0000.jpg

│   └── train.csv

├── test/

│   ├── images/

│   │  ├── test_img_0000.jpg

│   │  ├── test_img_0001.jpg

│   │  ├── ...

│   │  └── test_img_8499.jpg

│   └── test.csv

└── sample_submission.csv


[세부 설명]

본 대회는 이미지, 상황 설명, 질문, 선택지를 함께 활용해 정답 선택지 번호를 예측하는 멀티모달 질의응답 과제입니다.

  • train/: 학습 데이터 형식 예시를 제공하기 위한 폴더입니다. 실제 학습 데이터는 참가자가 직접 수집 및 구성해야 하며, 제공되는 학습 예시 샘플은 1개입니다.
  • test/: 평가용 데이터 폴더입니다. 총 8,500개 샘플로 구성되며, test.csv와 이미지 폴더가 포함됩니다.
  • train.csv: 컬럼은 sample_id, image_path, context, question, answers, label입니다. label은 정답 선택지 인덱스이며 0, 1, 2 중 하나입니다.
  • test.csv: 컬럼은 sample_id, image_path, context, question, answers입니다. answers는 3개 선택지로 구성된 JSON 형식 문자열입니다.
  • sample_submission.csv: 제출 양식 파일입니다. 컬럼은 sample_id, label이며, label에는 예측한 선택지 인덱스 0, 1, 2 중 하나를 입력합니다.

More Data