2023 Samsung AI Challenge : Camera-Invariant Domain Adaptation

알고리즘 | 비전 | 이미지 분할 | 도메인 적응 | mIoU

상금 : 2,100만 원
2023.08.21 ~ 2023.10.02 10:00 + Google Calendar
779명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

[ Private 9th : 0.63704 ] UDA 방법론 코드, PPT

태훈_

2023.10.26 14:59 2,863 조회 language

UDA를 처음 접하고 정보도 많이 없어서 대회를 진행하는데 많이 힘들었지만 그만큼 얻어가는 것도 많은 것 같습니다.

생각보다 재미있는 주제라서 다른 분들도 참고해서 같이 알아가면 좋을 거 같다는 생각으로 올리게 되었습니다.

PPT와 코드에는 안나와 있지만 Slide Prediction 방법에서 이미지를 Batch로 만들어 추론하는 경우 Encoder로 MiT-B3를 사용할 때 Tesla T4기준 평균 FPS가 25정도 나옵니다.
- 256x512의 해상도를 한번에 추론할 경우 평균 FPS : 27,
- 512x1024의 해상도를 한번에 추론할 경우 평균 FPS : 10
[해당 코드를 서면평가 때 넣지 않았어서 코드에는 없습니다. 만약 요청해주시면 보내드리겠습니다.]

발표평가용으로 만들다가 급하게 서면평가용으로 PPT를 바꾸다보니 몇몇 내용을 못 넣고 제출해서 많이 아쉬운 부분인 거 같습니다.

PPT 내용에서 잘못 되거나 방법론에 대해서 질문 사항 있으시면 편하게 말씀해주세요

사전에 데이터셋 이미지들을 512 x 1024로 Resize 해서 저장해두었습니다.

[2023-11-06 수정] : 코드 내에서 Pseudo Label을 생성할 때는 Augmentation을 적용한 Target Image를 Teacher 모델에 넣었는데 이는 잘못된 방법입니다.
당시에는 급하게 구현하느라 제대로 못봤는데 제대로 구현하시려면 Augmentation을 적용하지 않은 Target Image를 Teacher 모델에 넣어 Pseudo Label을 만들고 Augmentation을 적용하셔야 합니다.

PDF