분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Baseline] Resnet50 + LSTM
안녕하세요. 데이콘입니다.
데이콘 베이스라인은 모든 참가자의 '제출'을 목표로 합니다.
해당 내용에 관한 질문은 [토크] 게시판에 게시해 주세요.
본 베이스라인은 Pytorch를 바탕으로 구현되었으며, Resnet50과 LSTM을 활용하여 해당 문제를 해결할 수 있는 가장 기본적인 방법을 제시합니다.
Resnet50을 CNN Backbone으로 Input Image에 대한 Feature를 추출하며, 추출된 Feature를 통해 mos를 Regression Head를 통해 학습하고 예측하며,
Input Image에 대한 Feature와 캡셔닝 토큰을 바탕으로 LSTM을 통해 캡셔닝 문장을 생성하는 방식입니다.
캡셔닝 모델을 학습시키는 것은 매우 정교한 하이퍼파라미터 튜닝과 충분한 학습이 이루어져야 할 것입니다.
참가자 여러분들만의 하이퍼파라미터로 해당 모델의 성능을 더욱 더 향상시킬 수 있을 것입니다.
물론, 베이스라인 코드의 해결 방식 이외의 방법으로도 많은 고도화된 모델을 생성해볼 수 있을 것입니다.
이러한 모든 가능성에 대해 참가자 여러분들께서 수많은 시도를 해보는 것을 기대하며,
이 과정 속에서 데이콘에서 제공드리는 베이스라인이 여러분만의 고도화된 모델 작성에 도움이 되면 좋겠습니다.
감사합니다.
데이콘 드림
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved