분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Private 1위 (0.9921), 3D rotation Estimation + MnistSimpleCNN
안녕하세요 코드공유드립니다.
이번 대회 데이터를 보면 기존 mnist 2D 이미지를 이진화하여 3차원으로 단순 확장 한 것을 알 수 있습니다.
만약 3D데이터를 반대로 2D 이미지로 변환을 성공하기만 하면 기존 mnist 에 버금가는 성능을 달성 할 수 있을거라 생각했습니다.
(현재 mnist dataset 의 sota 모델은 paperswithcode 사이트에 의하면 MnistSimpleCNN 으로 확인되며 accuracy 는 무려 0.9991 입니다.)
하지만 3D 데이터를 2D 를 변환할때 문제는 데이터가 3d random rotation 이 되어있다는 것 입니다.
다만 2D 데이터를 단순하게 확장하여 3D 로 만들었기 때문에 rotation value 값을 찾기가 한결 수월합니다.
2D 에서 적용되는 hough line transform 을 3D 로 확장하여 rotation value 값을 찾을 수도 있지만 (코드 마지막 부분)
저의 경우 딥러닝 모델을 사용하여 rotation value 를 estimation 하였습니다.
실험 내역은 아래와 같습니다
1. 3d cnn resnet-18 테스트 : 0.94
2. 3d rotation estimation + MnistSimpleCNN 테스트 : 0.96
3. rotation estimation 시 cascade inference 사용 : 0.98
4. ensemble MnistSimpleCNN model : 0.99
저도 3d -> 2d를 만드는 방식을 ai에게 학습하면 성능이 좋아질 것이라고 생각했었는데, 확실히 3d estimation으로 거의 2d mnist급 accuracy를 보여주게 되는 엄청난 성능향상이 이루어졌네요! 좋은 코드 잘 보고 갑니다.
좋은 코드 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
데이터가 정면을 보게 할 방법이 생각 안 나서 데이터 불리기만 했는데
그마저도 AI한테 시키면 되는 일이었네요.. ㄷㄷ
감탄하고 갑니다 bb