분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
파이토치를 활용한 Mask R-CNN 학습하기
파이토치 torchvision의 Mask R-CNN을 활용한 학습용 코드입니다. 기초적인 부분만 다뤘습니다.
저희는 mmdetection을 사용하지 않고 자체적으로 구현해서 사용했지만,
처음 instance segmentation을 해보시는 분, mmdetection을 사용하기 어렵거나 간단한 베이스라인을 구축을 위해
적절하게 수정해서 사용하시면 될 것 같습니다.
*해당 코드는 torchvision의 input 형태만 확인하고 만든 코드입니다.
*해당 코드는 1 epoch 정상 작동만 파악하고 업로드한 것을 알려드립니다.
image: a PIL Image of size (H, W)
target: a dict containing the following fields
- boxes (FloatTensor[N, 4])
- labels (Int64Tensor[N])
- image_id (Int64Tensor[1])
- area (Tensor[N])
- iscrowd (UInt8Tensor[N])
- masks (UInt8Tensor[N, H, W])
파이토치 라이트닝 설문조사하면 SWAG를 보내준다네요
https://bit.ly/35KTRRy
감사합니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드공유 감사합니다. 저는 encoder+FPN 으로 시도해봤는데 mask rcnn에 비해 성능이 한참 좋지못하군요