분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 3rd]Solution
먼저 코드 공유를 해주신 파이썬초보만님께 감사합니다.
jigsawformer에 변형을 주었습니다.
크게 2가지를 추가하고, hyper-parameter를 조정하였습니다.
1. Data augmentation (다양한 data augmentation을 통해서 모델의 강건성을 확보하고자 하였습니다)
- 특히 cutout 계열을 사용했을 때, 보다 효과적이었습니다.
2. flip / rotate 등 다양한 조건 부여
- 코드 진행 방식은 크게 다음과 같습니다
a) original image (순서가 섞인 이미지)를 입력으로 받아 정답 label을 통해 초기화
b) (핵심) 초기화된 이미지와 label에 flip / rotate를 확률적으로 가함
→ 단순히 제대로 된 방향의 퍼즐뿐만 아니라 뒤집히거나 돌아간 퍼즐 또한 잘 풀어야 함
c) 그 상태에서 random으로 섞어줌
pyper-parameter는 다음과 같습니다
1. optimizer AdamW
2. scheduler : CosineAnnealingWarmRestart
3. Batchsize 224 for train / 224 * 8 for validation / 224 * 8 for test
4. GPU : RTX A6000 48GB x 1EA
Backbone 구조에 대한 고민을 많이 해봤지만, 해당 코드는 image size를 256, 256으로 해야만하는 문제가 있었어서 개인적으로 아쉬웠습니다
CNN계열로 접근했더라면 좀 더 좋은 결과가 나오지 않았을까 싶네요!
잘 읽었습니다 수고하셨습니다!
코드부분을 더 개선해서 공유할까 하다가 하지는 않았는데요 아쉽군요
감사합니다
재미있는 경험을 할 수 있어서 즐거웠습니다 :)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
수고하셨습니다!
코드 잘 읽어봤습니다. 혹시 image size에 대한 여러 실험은 해보지 않으셨나요?