월간 데이콘 숫자 3D 이미지 분류 AI 경진대회

알고리즘 | CV | 분류 | 3D | Accuracy

  • moneyIcon Prize : 100만원 + ɑ
  • 524명 마감

 

[Private 4위, 0.96492] | MobileNetV2(3D) + Augmentation

공동작성자

stroke
2022.09.21 20:47 2,180 Views language

안녕하세요~ 데이콘은 처음으로 참가했습니다.

처음에는 "어떻게 우리가 익숙한 2차원으로 잘 투영시켜서 학습시킬까?" 라는 차원에서 접근했으나,
1) 이미 2차원 데이터에서 2D Convolution 기반 네트워크는 훌륭하게 MNIST를 잘 구분하고 있으며,
2) 3D 데이터로 구성 되었지만, 결국 MNIST 숫자 10개 예측하는 상대적으로 간단한 task 이고, 3D Convolution으로 네트워크를 만들면 잘 구분하지 않을까?
이러한 다소 직관적인 생각에서 출발했습니다.

모델의 정확도를 높이기 위해, 2D로 치면 픽셀 해상도에 해당하는 복셀 해상도를 높였습니다.(64*64*64)
또한 테스트 데이터 셋이 어떤 각도로 회전되어 있는지 모르기에 Open3D 라이브러리를 통해 X, Y, Z 축 기준으로 임의의 각도로 회전을 통해 데이터 셋을 증강했습니다.

이로 인한 연산량 증가 및 병목 현상을 완화하기 위해, 가벼운 모델인 MobileNetV2를 3D 데이터를 입력 받도록 레이어와 연산을 변환하여 사용했으며, 증강 데이터를 램에 올려서 캐싱하여 학습을 진행했습니다.


별 기대 없이 흥미로운 직관을 테스트 해보는 차원에서 참여했는데,  운좋게 상위권에 위치했던거 같습니다.
좋은 대회 열어주셔서 감사하고, 긴 기간동안 대회 참가하신 모든 분들 수고 많으셨습니다.

Code