2021 교통 수(手)신호 동작 인식 AI 경진대회

알고리즘 | CV | 객체탐지 | 제어 | LogLoss

Prize : 총 500만원
418명 마감

Practice

Overview Data Code (share) Talk Leaderboard

Submission

Private 1위 Slowfast

younggeun

2021.10.19 19:40 4,154 Views language

좋은 대회 열어주셔서 감사합니다.

##파일 실행법
먼저 https://github.com/younggeun-kim/dacon_private1st_hand에 들어가면 data_preprocess.ipynb와 train_and_inference.ipynb와 pytorchvideo라는 폴더가 있습니다.
1. 해당 코드를 clone해주시고 train_and_inference.ipynb가 있는 곳에 train데이터와 test데이터를 각각 train이라는 이름과 test라는 이름으로 폴더를 만들어줍니다.
2. https://drive.google.com/file/d/1b_D4xza4CeO8YWQmtITU8x898MeFd6am/view?usp=sharing에서 pertained weight를 다운받아 코드가 있는 폴더에 넣어줍니다.
3. data_preprocess.ipynb를 실행하면 cropped_train, cropped_train2, cropped_test, cropped_test2라는 폴더들이 생기게됩니다.
4. train_and_inference.ipynb를 실행하면 final_result.csv가 생성됩니다.

## IDEA
1. 저는 video classification 모델인 slowfast를 활용하였습니다.
2. 이미지 사이즈가 크기때문에 이미지를 crop 하여 사용하였으며, cropped_train(test)는 annotation 상하좌우로 20씩 패딩이 있게 crop 하였으며, cropped_train2(test2)는 annotation 대로 crop하였습니다. 이 두개의 데이터로 서로 다른 slowfast를 훈련시켰습니다.
3. 그리고 이미지가 아닌 pos 정보를 토대로 RGB이미지를 만들어 이를 slowfast에도 학습시켜 보았습니다.
4. 이들을 모두 앙상블하여 inference를 진행하였습니다.
5. argmax인 라벨의 값을 1.0으로 나머지를 0.0으로 post processing을 진행하였습니다.