월간 데이콘 TV 손동작 제어 인식 AI 경진대회

알고리즘 | 동영상 | 비전 | 분류 | Macro F1 Score

  • moneyIcon Prize : 인증서
  • 578명 마감

 

[Private 6th] r3d_18 model + preprocessing

공동작성자

stroke
2023.02.06 20:22 2,280 Views language

BaseLine 코드 참조함.
torchvision의 r3d_18 model 사용.
CrossEntropyLoss에 class_weights 계산하여 사용.
BaseModel에 Linear Layer 추가.

학습환경 : 3090Ti 2장

Code
로그인이 필요합니다
0 / 1000
seokjin1013
2023.02.07 18:34

코드 공유 감사드립니다. BaseModel 클래스에서 self.feature_extractor를 선언하신 부분에서 궁금한 게 있어요. pretrained모델을 가져다 사용할 때 마지막 레이어로 [Linear(400, 200), ReLU, Linear(200, 5)]로 하셨는데, 저는 그냥 Linear(400, 5)로 했거든요... 바로 5로 줄이지 않고 200을 거쳐 5로 줄이면 좀 더 좋은가요?

EISLab_이희원
2023.02.07 19:27

제 경험상 linear layer 한 개 보다 두개의 linear layer을 사용하는 것이 좀 학습 속도도 향상되고 정확도도 향상되더라구요!

seokjin1013
2023.02.07 21:51

오 그렇군요 감사합니다! 그런데 혹시 Linear layer를 하나 더 사용하면 연산량이 늘어나는데 학습 속도도 빨라지나요?

EISLab_이희원
2023.02.07 22:07

이론적인 부분은 잘 모르겠으나, 제 경험상 그랬습니다

seokjin1013
2023.02.07 23:52

감사합니다 많은 도움 되었습니다!