K-Fashion AI Competition

Algorithm | CV | Semantic Segmentation | Image segmentation | mAP

10,000,000 KRW
779 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

파이토치를 활용한 Mask R-CNN 학습하기

우주대마왕

2020.11.18 14:37 21,537 Views language

파이토치 torchvision의 Mask R-CNN을 활용한 학습용 코드입니다. 기초적인 부분만 다뤘습니다.
저희는 mmdetection을 사용하지 않고 자체적으로 구현해서 사용했지만,
처음 instance segmentation을 해보시는 분, mmdetection을 사용하기 어렵거나  간단한 베이스라인을 구축을 위해
적절하게 수정해서 사용하시면 될 것 같습니다.

*해당 코드는 torchvision의 input 형태만 확인하고 만든 코드입니다.
*해당 코드는 1 epoch 정상 작동만 파악하고 업로드한 것을 알려드립니다.

image: a PIL Image of size (H, W)
target: a dict containing the following fields
    - boxes (FloatTensor[N, 4])
    - labels (Int64Tensor[N])
    - image_id (Int64Tensor[1])
    - area (Tensor[N])
    - iscrowd (UInt8Tensor[N])
    - masks (UInt8Tensor[N, H, W])