Dacon Monthly Visual Question Answering AI Challenge

Algorithm | Multi-Modal | NLP | CV | VQA | Accuracy

 

[Private 31th] ResNet50 + DistilBERT(MCB, attention)

공동작성자
2023.08.12 14:58 2,013 Views language

이미지 모델을 ReseNet50, 자연어 모델을 DistilBERT를 사용했습니다.
이미지와 텍스트 데이터에 대해서 Multi-modal Compact Bilinear (MCB) model with Attention mechanism을 이용했습니다.

Code