월간 데이콘 숫자 3D 이미지 분류 AI 경진대회

알고리즘 | CV | 분류 | 3D | Accuracy

  • moneyIcon 상금 : 100만원 + ɑ
  • 524명 마감

 

Private 1위 (0.9921), 3D rotation Estimation + MnistSimpleCNN

2022.09.22 14:31 2,983 조회 language

안녕하세요 코드공유드립니다.

이번 대회 데이터를 보면 기존 mnist 2D 이미지를 이진화하여 3차원으로 단순 확장 한 것을 알 수 있습니다.
만약 3D데이터를 반대로 2D 이미지로 변환을 성공하기만 하면 기존 mnist 에 버금가는 성능을 달성 할 수 있을거라 생각했습니다.
(현재 mnist dataset 의 sota 모델은 paperswithcode 사이트에 의하면 MnistSimpleCNN 으로 확인되며 accuracy 는 무려 0.9991 입니다.)
하지만 3D 데이터를 2D 를 변환할때 문제는 데이터가 3d random rotation 이 되어있다는 것 입니다.
다만 2D 데이터를 단순하게 확장하여 3D 로 만들었기 때문에 rotation value 값을 찾기가 한결 수월합니다.
2D 에서 적용되는  hough line transform 을 3D 로 확장하여 rotation value 값을 찾을 수도 있지만 (코드 마지막 부분)
저의 경우 딥러닝 모델을 사용하여 rotation value 를 estimation 하였습니다.

실험 내역은 아래와 같습니다
1.  3d cnn resnet-18 테스트 : 0.94
2. 3d rotation estimation + MnistSimpleCNN  테스트 : 0.96 
3. rotation estimation 시  cascade inference 사용 : 0.98
4. ensemble  MnistSimpleCNN  model : 0.99

코드
로그인이 필요합니다
0 / 1000
낼모레
2022.09.23 10:32

데이터가 정면을 보게 할 방법이 생각 안 나서 데이터 불리기만 했는데
그마저도 AI한테 시키면 되는 일이었네요.. ㄷㄷ
감탄하고 갑니다 bb

lastdefiance20
2022.09.24 18:37

저도 3d -> 2d를 만드는 방식을 ai에게 학습하면 성능이 좋아질 것이라고 생각했었는데, 확실히 3d estimation으로 거의 2d mnist급 accuracy를 보여주게 되는 엄청난 성능향상이 이루어졌네요! 좋은 코드 잘 보고 갑니다.

딱따구리부리박기
2022.11.23 14:43

좋은 코드 감사합니다.