이미지 기반 질의 응답 AI 경진대회 월간 데이콘

알고리즘 | 멀티모달 | 언어 | 비전 | 이미지 기반 질의 응답 | Accuracy

  • moneyIcon 인증서
  • 658명 마감

 

사전학습모델 규칙 추가 안내 [23.07.14 17:22]

2023.07.14 17:22 1,729 조회

안녕하세요 데이콘입니다.


데이커들의 원활한 대회 참여를 위해서 '사용 가능한 사전 학습 모델의 범위'에 대해 추가 안내를 드리고자 합니다.

본 대회의 [대회안내] 탭, [규칙]란에는 사용 가능한 데이터와 사전 학습 모델에 대한 범위가 명시되어 있습니다.


3. 데이터 허용 범위

  • 대회 제공 데이터 이외의 외부 데이터 사용 금지
  • 대회 제공 데이터 중 Test Dataset은 리더보드 제출을 위한 추론에만 사용 가능 (모델 학습 사용 불가능)
  • Data Leakage (참고 : Data Leakage에 대한 개인적인 정리) 혹은 규칙 위반이 의심되는 경우 코드를 요청할 수 있음


4. 사전 학습 모델 허용 범위

  • 사용에 법적 제약이 없고 논문으로 공개된 사전 학습된 모델(Pretrained Model Weight) 사용 가능
  • 단, VQA(VQA Consortium 소유) 데이터셋으로 사전학습/fine-tuning된 모델 사용 불가
  • COCO 이미지 데이터셋으로 사전학습된 모델은 사용 가능
  • 사용하고자 하는 사전 학습된 모델에 VQA Dataset이 포함되어 있는지 자체 확인이 불가능한 경우 dacon@dacon.io로 문의


위 규칙에 언급된 VQA 데이터셋은 'VQA 형식의 데이터'를 의미하는 것이 아니라 'VQA Consortium 소유의 VQA 데이터셋'을 뜻합니다.

따라서 특정 모델의 사전학습 혹은 fine-tuning 데이터에 이 데이터셋이 포함되어 있다면, 해당 모델은 본 대회에서 사용이 불가능합니다.


사용하고자 하는 모델이 VQA 데이터셋으로 사전학습 혹은 fine-tuning 되었는지 확인하기 위해서는

해당 모델의 논문이나 깃허브 레포지토리를 참고할 수 있습니다.



특히 주의하실 것은 사전학습 데이터에 VQA 데이터셋이 포함되지 않지만, VQA 데이터셋에 대해 fine-tuning한 모델의 가중치가 배포 및 공개된 경우입니다.

예를 들어 ViLT(Vision-and-Language Transformer) 모델은 사전학습에 VQA 데이터셋을 포함하지 않으므로 사용 가능합니다.

하지만 ViLT 모델을 VQA 데이터셋에 fine-tuning한 모델은 사용할 수 없습니다.

위와 같은 모델(vilt-b32-finetuned-vqa)을 사용한 결과를 제출하는 것은 본 대회에서 부정행위로 간주되므로 대회 참여가 제한될 수 있습니다.



감사합니다.

로그인이 필요합니다
0 / 1000
청소
2023.07.14 17:29

https://huggingface.co/microsoft/git-base-coco

이모델로 제출해보긴 했는데 제가 확인한 바로는 규정 위반은 아니었지만 혹시 몰라서 확인차 사용가능한지 여쭤보겠습니다.

DACON.chanmuzi
2023.07.14 21:15

안녕하세요 청소님.

확인 결과 위 모델은 사용 가능합니다.
하지만 이를 VQA 데이터셋으로 fine-tuning한 모델의 가중치가 공개되어 있고, 이 가중치를 활용하는 것은 불가능합니다.
따라서 모델을 사용하실 때 이 부분에 유의하시길 바랍니다.

감사합니다.

flyinghooniman
2023.07.25 15:18

https://textvqa.org

이 데이터셋으로 finetuning한 모델은 사용할 수 있나요?

DACON.chanmuzi
2023.07.25 15:37

안녕하세요 flyinghooniman님.

해당 데이터셋으로 fine-tuning한 모델은 사용 가능합니다.

감사합니다.

이세의인공지능
2023.08.06 08:30

제출 후에 점수가 너무 높아 깜짝 놀라서 토크를 확인해보니 이 규정에 대해 늦게 인지해 글을 올립니다.
VQAv2가 포함된 사전학습 모델을 사용해 학습했으며, 참가자들에게 혼란을 줄 수 있을 것 같아 리더보드에서 제외해주셨으면 합니다.

DACON.chanmuzi
2023.08.06 15:33

안녕하세요 이세의인공지능님.

문제 상황을 인지하시고 바로 공유해주심에 감사드립니다.

VQAv2가 포함된 사전학습 모델로 학습한 결과를 제출하는 것은 부정제출에 해당합니다.
따라서 본 대회의 리더보드에 제출 결과가 노출되지 않도록 조치했음을 안내드립니다.

감사합니다.

이세의인공지능
2023.08.06 16:47

빠른 조치 감사합니다!
좋은 주말 되세요!