2023 Samsung AI Challenge : Image Quality Assessment

알고리즘 | 비전 | 언어 | 이미지 캡셔닝 | Custom Metric

  • moneyIcon 상금 : 2,100만 원
  • 414명 마감

 

[Baseline] Resnet50 + LSTM

2023.08.21 10:29 3,175 조회 language


안녕하세요. 데이콘입니다.

데이콘 베이스라인은 모든 참가자의 '제출'을 목표로 합니다. 
해당 내용에 관한 질문은 [토크] 게시판에 게시해 주세요.

본 베이스라인은 Pytorch를 바탕으로 구현되었으며, Resnet50과 LSTM을 활용하여 해당 문제를 해결할 수 있는 가장 기본적인 방법을 제시합니다.
Resnet50을 CNN Backbone으로 Input Image에 대한 Feature를 추출하며, 추출된 Feature를 통해 mos를 Regression Head를 통해 학습하고 예측하며,
Input Image에 대한 Feature와 캡셔닝 토큰을 바탕으로 LSTM을 통해 캡셔닝 문장을 생성하는 방식입니다. 
캡셔닝 모델을 학습시키는 것은 매우 정교한 하이퍼파라미터 튜닝과 충분한 학습이 이루어져야 할 것입니다.
참가자 여러분들만의 하이퍼파라미터로 해당 모델의 성능을 더욱 더 향상시킬 수 있을 것입니다.
물론, 베이스라인 코드의 해결 방식 이외의 방법으로도 많은 고도화된 모델을 생성해볼 수 있을 것입니다.
이러한 모든 가능성에 대해 참가자 여러분들께서 수많은 시도를 해보는 것을 기대하며, 
이 과정 속에서 데이콘에서 제공드리는 베이스라인이 여러분만의 고도화된 모델 작성에 도움이 되면 좋겠습니다.

감사합니다. 
데이콘 드림

코드
이전 글
CLIPCAP 기반 Caption Generation 코드(PB기준 0.7)
대회 - 2023 Samsung AI Challenge : Image Quality Assessment
좋아요 6
조회 985
댓글 0
7달 전
현재 글
[Baseline] Resnet50 + LSTM
대회 - 2023 Samsung AI Challenge : Image Quality Assessment
좋아요 6
조회 3,175
댓글 0
9달 전
다음 글
다음 글이 존재하지 않습니다.