2021 Ego-Vision 손동작 인식 AI 경진대회

알고리즘 | CV | 분류 | 제어 | LogLoss

상금 500만 원
510명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

Private 4위, LightGBM + CLIP

게으름뱅이

2021.10.19 12:53 6,839 조회 language

여러 keypoint와 이미지로부터 여러 Feature를 extraction하고 최종적으로 LightGBM을 활용하여 모델을 만들었습니다.

이미지 feature를 임베딩하기 위해 CLIP을 활용하였습니다.

gesture_type, hand_type, pose_name을 순서대로 학습하여 예측한 type을 다음 모델의 input으로 사용하였습니다.

Ryzen 5 3600 + 2060 super 기준, 전처리 및 학습부터 예측까지 약 40분 정도 소요되며,
제 PC 환경 상 py 파일이 아닌 Jupyter notebook에서 실행 시 PyTorch DataLoader의 num_workers를 늘리면 문제가 발생하여 0으로 시행하였습니다. (참고: https://github.com/pytorch/pytorch/issues/51344)
이를 늘린다면 시간을 단축할 수 있습니다.

감사합니다.

코드