2023 Samsung AI Challenge : Camera-Invariant Domain Adaptation

알고리즘 | 비전 | 이미지 분할 | 도메인 적응 | mIoU

  • moneyIcon 상금 : 2,100만 원
  • 757명 마감

 

[ Private 9th : 0.63704 ] UDA 방법론 코드, PPT

2023.10.26 14:59 1,875 조회 language

UDA를 처음 접하고 정보도 많이 없어서 대회를 진행하는데 많이 힘들었지만 그만큼 얻어가는 것도 많은 것 같습니다.

생각보다 재미있는 주제라서 다른 분들도 참고해서 같이 알아가면 좋을 거 같다는 생각으로 올리게 되었습니다.

PPT와 코드에는 안나와 있지만 Slide Prediction 방법에서 이미지를 Batch로 만들어 추론하는 경우 Encoder로 MiT-B3를 사용할 때 Tesla T4기준 평균 FPS가 25정도 나옵니다.
- 256x512의 해상도를 한번에 추론할 경우 평균 FPS : 27, 
- 512x1024의 해상도를 한번에 추론할 경우 평균 FPS : 10
[해당 코드를 서면평가 때 넣지 않았어서 코드에는 없습니다. 만약 요청해주시면 보내드리겠습니다.]

발표평가용으로 만들다가 급하게 서면평가용으로 PPT를 바꾸다보니 몇몇 내용을 못 넣고 제출해서 많이 아쉬운 부분인 거 같습니다.

PPT 내용에서 잘못 되거나 방법론에 대해서 질문 사항 있으시면 편하게 말씀해주세요

사전에 데이터셋 이미지들을 512 x 1024로 Resize 해서 저장해두었습니다.

[2023-11-06 수정] : 코드 내에서 Pseudo Label을 생성할 때는 Augmentation을 적용한 Target Image를 Teacher 모델에 넣었는데 이는 잘못된 방법입니다.
당시에는 급하게 구현하느라 제대로 못봤는데 제대로 구현하시려면 Augmentation을 적용하지 않은 Target Image를 Teacher 모델에 넣어 Pseudo Label을 만들고 Augmentation을 적용하셔야 합니다.

PDF
코드
로그인이 필요합니다
0 / 1000
48hour
2023.10.26 18:15

감사합니다! 공유해주신 코드로 열공해보겠습니다!

태훈_
2023.10.26 18:33

많이 부족한 코드긴 하지만 도움이 되셨으면 좋겠습니다 :)

Dalsong
2023.10.26 19:46

정말 공부해보고싶었는데 공유해주셔서 감사합니다 :)

태훈_
2023.10.26 20:44

제가 참고한 논문과 구조는 다르지만 방향성은 비슷하다고 생각되어서 참고하는 방향으로 보셔도 좋을 거 같습니다 ㅎㅎ