서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 6th] r3d_18 model + preprocessing
공동작성자
BaseLine 코드 참조함.
torchvision의 r3d_18 model 사용.
CrossEntropyLoss에 class_weights 계산하여 사용.
BaseModel에 Linear Layer 추가.
학습환경 : 3090Ti 2장
제 경험상 linear layer 한 개 보다 두개의 linear layer을 사용하는 것이 좀 학습 속도도 향상되고 정확도도 향상되더라구요!
오 그렇군요 감사합니다! 그런데 혹시 Linear layer를 하나 더 사용하면 연산량이 늘어나는데 학습 속도도 빨라지나요?
이론적인 부분은 잘 모르겠으나, 제 경험상 그랬습니다
감사합니다 많은 도움 되었습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 공유 감사드립니다. BaseModel 클래스에서 self.feature_extractor를 선언하신 부분에서 궁금한 게 있어요. pretrained모델을 가져다 사용할 때 마지막 레이어로 [Linear(400, 200), ReLU, Linear(200, 5)]로 하셨는데, 저는 그냥 Linear(400, 5)로 했거든요... 바로 5로 줄이지 않고 200을 거쳐 5로 줄이면 좀 더 좋은가요?