[1주년 기념] 데이스쿨 최대 40% 할인 🎁
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
별 다른 이유는 아니고, SAM을 사용하는 학습이 비교적 오래 걸려서 최적해에 수렴하는 시간을 단축해 보려고 gelu를 사용했었습니다.
그 후 이전에 만들었던 Adam만 사용한 모델과 앙상블을 해보니 더 높은 accuracy가 나와서 두 모델을 사용한 버전을 공유드렸습니다 ㅎㅎ
아 그렇군요! 답변 감사합니다:)
SAM Optimizer 가 좋은 효과를 보였다니 다행이네요 :) 축하드립니다.
감사합니다! 소개해주신 기법들이 도움이 많이 되었습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 공유 감사합니다! 그리고 축하드려요:)
한가지 질문이 있습니다.
optimizer(SAM, Adam)에 따라서 activation function(gelu, relu)을 다른 걸 쓰신거 같은데 특별한 이유가 있을까요?