2021 Ego-Vision 손동작 인식 AI 경진대회

알고리즘 | CV | 분류 | 제어 | LogLoss

  • moneyIcon Prize : 총 500만원
  • 506명 마감

 

Private 4위, LightGBM + CLIP

2021.10.19 12:53 3,327 Views language

여러 keypoint와 이미지로부터 여러 Feature를 extraction하고 최종적으로 LightGBM을 활용하여 모델을 만들었습니다.

이미지 feature를 임베딩하기 위해 CLIP을 활용하였습니다.

gesture_type, hand_type, pose_name을 순서대로 학습하여 예측한 type을 다음 모델의 input으로 사용하였습니다.

Ryzen 5 3600 + 2060 super 기준, 전처리 및 학습부터 예측까지 약 40분 정도 소요되며, 
제 PC 환경 상 py 파일이 아닌 Jupyter notebook에서 실행 시 PyTorch DataLoader의 num_workers를 늘리면 문제가 발생하여 0으로 시행하였습니다. (참고: https://github.com/pytorch/pytorch/issues/51344)
이를 늘린다면 시간을 단축할 수 있습니다.

감사합니다. 

Code