2023 Samsung AI Challenge : Camera-Invariant Domain Adaptation

알고리즘 | 비전 | 이미지 분할 | 도메인 적응 | mIoU

  • moneyIcon 상금 : 2,100만 원
  • 738명 마감

 

Class 및 Run Length Encoding 관련

2023.08.19 11:55 1,911 조회

안녕하세요, 데이콘입니다.


먼저 본 대회의 데이터셋에 존재하는 12가지 class의 정보는 다음과 같습니다.

(Pixel Value의 경우 Ground Truth 이미지에만 해당됩니다)

null


본 경진대회에서는 이런 class들이 존재하는 test 이미지 세그멘테이션 결과를 제출하는 데 있어서 효율성을 높이기 위해 RLE(Run-Length Encoding)를 사용하고 있습니다.

다만, 인코딩을 수행하는 동안 마스크는 이진값(binary)이어야 합니다.

따라서 베이스라인에서는 예측된 이미지에서 0~11까지의 픽셀값을 바탕으로 각 class의 위치를 도출하여,

1(True)값을 마스크된 픽셀(class)로 표현하고, 0(False)값을 마스크되지 않은 픽셀(해당 class를 제외한 나머지 영역)로 표현합니다.


이렇게 인코딩된 제출물은 이미지 1개를 12행의 'mask_rle' 형식으로 표현하며,

'mask_rle' 형식은 쌍의 값을 공백으로 구분된 목록으로 요구합니다.

예를 들어, '1 3 10 5'는 픽셀 1,2,3 및 10,11,12,13,14가 마스크에 포함되어야 함을 의미합니다.

이러한 방식을 통해 대량의 이미지 데이터를 효율적으로 압축하고, 제출하고, 표현할 수 있습니다.


감사합니다.

로그인이 필요합니다
0 / 1000
꾸라짱
2023.09.03 13:29

질문 있습니다.

train_source의 ground truth 이미지를 보면, 범퍼의 픽셀값만 (class)가 255 (흰색) 인것을 확인 할 수 있습니다. 그러면 ,  fish eye 이미지에서 카메라 테두리는 픽셀값이 0(검은색)인가요 255(흰색)인가요?

DACON.SeungYoon
2023.09.04 11:05

안녕하세요, 꾸라짱 님
모든 ground truth에서 픽셀값 0은 class 0(Road)에 해당하며,
카메라 테두리는 배경(픽셀값 255)으로 취급됩니다.
감사합니다.