분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
EDA 기반 학습하기
안녕하세요 CV를 다시 기초부터 공부하면서 복습할 겸 간단하게 구현해봤습니다.
EDA 결과 학습 데이터 수는 700여장으로 적은편이며, Class도 고르게 분포되어 있습니다.
또한 시각화 결과 전부는 아니지만 비슷한 위치에서 찍은 사진들이 대부분입니다.
이를 기반으로 CNN 모델 중 성능은 괜찮으면서 Layer가 낮은 ResNet18로 학습했습니다.
근거는 데이터 수가 적고 class 불균형이 거의 없고, 비슷한 위치에서 찍은 사진들이 대부분이기에
많은 Parameter를 요구하지 않다고 판단했기 때문입니다.
이미지 크기는 제가 가진 CPU, GPU가 버티질 못해서 512로 resizing해서 진행했습니다.
비교적 데이터도 적고 간단한 Task이고, 평가 metric이 acc이므로 다른 metric은 계산하지 않았습니다.
EDA 결과 rotation 된 데이터 사진들이 있습니다. 따라서 augmentation에 rotation을 준 형태로 학습을 해야
private score에서도 적절한 score를 얻을 수 있다고 판단됩니다.
고맙습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved