저해상도 조류 이미지 분류 AI 경진대회

알고리즘 | 월간 데이콘 | Vision | 분류 | Macro F1 Score

  • moneyIcon 상금 : 인증서 + 데이스쿨
  • 902명 마감

 

SwinV2 baseline (public: 0.96818)

2024.04.16 07:46 2,037 조회 language

swinv2 모델을 이용한 baseline입니다. (colab환경)
논문과 깃허브상에서 imagenet을 이용하여 pretrain(imagenet22k)과 finetune(imagenet1k)을 진행했다고 나와있습니다 https://github.com/microsoft/Swin-Transformer (틀렸다면 지적 부탁드립니다)
swinv2 모델의 resolution을 변경하는 이런저런 시도들을했지만 좋지 않았습니다.

코드
로그인이 필요합니다
0 / 1000
basslibrary
2024.04.18 12:12

트랜스포머 모델이 CNN에 비해 크기가 상대적으로 커서, 
CNN 관련 모델만 보고 있었는데, Transformer 기반모델의 성능이 훨 좋네요.
저는 위의 기본 코드에 ImageAugmentation 을 추가로 더 진행했는데, 점수향상이 있었습니다.
감사합니다.

곰퓨타피죤
2024.04.19 15:28

pytorch lightning 2.2버전도 나와있는것으로 아는데 혹시 1.7(상당히 오래전)버전을 사용한 이유가 있는지 궁금합니다!

파이썬초보만
2024.04.20 12:57

안녕하세요. 큰 이유는 없고 여러 라이브러리 사용하다가 충돌이 생긴 상태여서 버전을 낮췄습니다.

곰퓨타피죤
2024.04.20 14:45

감사합니다
깃헙에서 사용되는 코드들 보면 어떨때는 낮은버전, 어떤코드는 최신버전이라 보통 어떤 환경에서 다들 실험을 진행하는지 궁금했었거든요