K-Fashion AI 경진대회

알고리즘 | 이미지 | 영상분할 | 이미지 세분화 | mAP

상금 1,000만 원
779명 마감

연습

대회안내 데이터 코드 공유 토크 리더보드

제출

파이토치를 활용한 Mask R-CNN 학습하기

우주대마왕

2020.11.18 14:37 21,535 조회 language

파이토치 torchvision의 Mask R-CNN을 활용한 학습용 코드입니다. 기초적인 부분만 다뤘습니다.
저희는 mmdetection을 사용하지 않고 자체적으로 구현해서 사용했지만,
처음 instance segmentation을 해보시는 분, mmdetection을 사용하기 어렵거나  간단한 베이스라인을 구축을 위해
적절하게 수정해서 사용하시면 될 것 같습니다.

*해당 코드는 torchvision의 input 형태만 확인하고 만든 코드입니다.
*해당 코드는 1 epoch 정상 작동만 파악하고 업로드한 것을 알려드립니다.

image: a PIL Image of size (H, W)
target: a dict containing the following fields
    - boxes (FloatTensor[N, 4])
    - labels (Int64Tensor[N])
    - image_id (Int64Tensor[1])
    - area (Tensor[N])
    - iscrowd (UInt8Tensor[N])
    - masks (UInt8Tensor[N, H, W])