Hand gesture classification AI Hackathon

Structured | Accuracy

참가시 최소 50 XP, 특별상 데이콘 후드
551 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

[소 뒷걸음질] CNN

청소

2022.03.08 15:00 3,586 Views language

기세현님의 좋은 인사이트를 참고했고
몇가지 근거 없는 생각으로 모델을 작성했습니다.

1. 이미지로 접근하는게 맞다면 레이어는 깊어야 하지 않을까? 하지만 데이터가 적은데?
-> 1x1 conv로 패러미터는 줄이고 레이어를 깊게 해보았습니다.

2. CNN을 통한 특성 추출시 앞부분은 작은 커널 사이즈 뒤로 갈 수록 큰 커널 사이즈로 해야 되지 않을까?
-> 이미지가 작아서 처음 부분은 최대한 많은 부분을 봐야 할 것 같았습니다.

3. 이미지 크기가 8x4 크기인데 MaxPooling으로 피쳐를 추출하는 것이 맞는 선택인가?
-> MaxPooling을하면 이미지의 shape이 떨어지기 때문에 이미 작은 사이즈의 이미지라면 사용하지 않는 것이 좋아보였습니다.

PB 기준이고 일반화 같은 건 생각도 안한 상태여서 생각 정도만 이야기 나누면 좋을 것 같습니다.

Code