분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
ResNet 구현 및 수정하기 (public 0.915)
안녕하세요 lastdefiance20입니다.
CNN에서 0.88이후 성능폭이 향상되지 않아 ResNet의 Residual Block을 제작하고, 마음대로 수정해서(올바른 방향인지는 모르겠지만) 성능을 올려보았습니다.
라벨 스무딩 기법 등 해보고 싶은 실험들이 많았는데 시간이 부족해서 다 해보지는 못했습니다. (gpu가 그닥 좋지않아서 한번 실험하는데 반나절이 소요)
데이터를 불러오는 부분은 Dacon에서 제공한 baseline을 참고하였으며, TTA 부분은 soymilk님의 코드를 참고하였습니다.
CNN쪽에 자세한 설명을 해놓았기 때문에 중복되는 부분은 서술하지 않았습니다.
ResNet50C + Data Augmentation + TTA = public 0.8996
ResNet50CL + Data Augmentation + TTA = public 0.9092
ResNet50C + ResNet50CL (앙상블) = public 0.915
피드백, 궁금증은 댓글로 남겨주시면 감사하겠습니다.
감사합니다.
혹시 mixup은 TTA와 함께 사용하면 안되는건가요??(TTA시 데이터 증강은 mixup으로 만들지 않고 회전 등으로만 해준다고 가정).
당시에 제가 봤던 코드들 같은 경우에는 Mixup을 적용하면 TTA를 사용하지 않고, Mixup을 적용하지 않으면 TTA를 사용하는 경우가 많아서 함께 사용하지 않았었습니다. (또한 성능도 안좋더군요)
하지만 함께 사용하는 경우도 존재하고, 데이터셋에 따라 성능이 다르기 때문에 mixup과 TTA를 같이 사용하지 못할 이유는 없다고 생각합니다. 말씀하신것처럼 만약 mixup과 같이 사용한다면 TTA시 증강은 회전 등으로만 적용하는것이 맞습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다