분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
파이토치를 활용한 Mask R-CNN 학습하기
파이토치 torchvision의 Mask R-CNN을 활용한 학습용 코드입니다. 기초적인 부분만 다뤘습니다.
저희는 mmdetection을 사용하지 않고 자체적으로 구현해서 사용했지만,
처음 instance segmentation을 해보시는 분, mmdetection을 사용하기 어렵거나 간단한 베이스라인을 구축을 위해
적절하게 수정해서 사용하시면 될 것 같습니다.
*해당 코드는 torchvision의 input 형태만 확인하고 만든 코드입니다.
*해당 코드는 1 epoch 정상 작동만 파악하고 업로드한 것을 알려드립니다.
image: a PIL Image of size (H, W)
target: a dict containing the following fields
- boxes (FloatTensor[N, 4])
- labels (Int64Tensor[N])
- image_id (Int64Tensor[1])
- area (Tensor[N])
- iscrowd (UInt8Tensor[N])
- masks (UInt8Tensor[N, H, W])
파이토치 라이트닝 설문조사하면 SWAG를 보내준다네요
https://bit.ly/35KTRRy
감사합니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드공유 감사합니다. 저는 encoder+FPN 으로 시도해봤는데 mask rcnn에 비해 성능이 한참 좋지못하군요