서울 랜드마크 이미지 분류 AI 해커톤

알고리즘 | CV | 분류 | 랜드마크 | Accuracy

상금 : 인증서, 장학금, 스타벅스 기프티콘 등
512명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

EDA 기반 학습하기

꿈을꿔

2022.08.19 18:48 1,352 조회 language

안녕하세요 CV를 다시 기초부터 공부하면서 복습할 겸 간단하게 구현해봤습니다.

EDA 결과 학습 데이터 수는 700여장으로 적은편이며, Class도 고르게 분포되어 있습니다.

또한 시각화 결과 전부는 아니지만 비슷한 위치에서 찍은 사진들이 대부분입니다.

이를 기반으로 CNN 모델 중 성능은 괜찮으면서 Layer가 낮은 ResNet18로 학습했습니다.

근거는 데이터 수가 적고 class 불균형이 거의 없고, 비슷한 위치에서 찍은 사진들이 대부분이기에

많은 Parameter를 요구하지 않다고 판단했기 때문입니다.

이미지 크기는 제가 가진 CPU, GPU가 버티질 못해서 512로 resizing해서 진행했습니다.

비교적 데이터도 적고 간단한 Task이고, 평가 metric이 acc이므로 다른 metric은 계산하지 않았습니다.

EDA 결과 rotation 된 데이터 사진들이 있습니다. 따라서 augmentation에 rotation을 준 형태로 학습을 해야

private score에서도 적절한 score를 얻을 수 있다고 판단됩니다.

고맙습니다.