아리랑 위성영상 AI 객체 검출 경진대회

unlabeled data 사용관련 질문

2020.10.18 12:36 4,919 조회
  • 외부 학습 데이터 사용 금지
  1. 오직 경진대회용 데이터셋만을 활용해야 합니다. (외부 데이터 활용 금지)
  2. Pre-trained 모델은 사용 가능하지만 사용한 모델의 아키텍처에 대해 추후 구체적으로 기술해야 합니다.



대회 규칙을 보면 위와 같이 명시되어 있는데요, 2가지 궁금한 점이 있습니다.


  1. unlabeled data도 사용하면 안되는 걸까요?
  2. pre-trained model을 직접 만들어도 되는 건가요?
  3. 여기에 unlabeled를 데이터를 써도 되는지...
  4. imagenet pretrained 만 되는 지...


답변 부탁드립니다.

감사합니다.


로그인이 필요합니다
0 / 1000
DACON.JIN
2020.10.19 17:13

안녕하세요. dhkim0225님 unlabeled data 사용은 제한됩니다. 경진대회에서 제공되는 데이터만을 사용하셔야 합니다.
Pretrained 모델의 경우 weight 사용이 가능 하나 pseudo labeling 이나 test 데이터셋을 이용해 pretrained 모델을 만드는 등의 행위는 제한되며 추후 순위권에들 경우 코드 제출 시 사용한 모델에 대해 상세히 기술해주셔야 합니다.

우디
2020.10.19 20:25

답변 감사합니다.
아래 내용 확인 부탁드립니다.

1. unlabeled 데이터는 사용하면 안됨.
2. pretrained 모델을 만드는 것 또한 안됨.
3. pretrained 모델은 공개되어 있는 것만 사용.

맞나요?

우디
2020.10.20 21:14

@DACON.JIN
DOTA dataset 을 이용해서 pretrained model weight를 만드는 건 되는거죠?

Dylan
2020.10.20 13:18

DOTA 데이터셋으로 학습한 pretrained model을 사용하는건 가능한가요?

우디
2020.10.20 18:47

기준이 너무 애매한 것 같아요.

DACON.JIN
2020.10.21 10:50

안녕하세요.  해당 내용에 대해 답변드리겠습니다. 

1. 외부 데이터 사용은 제한됩니다. 

2. 공개되어 있는 pretrained weight 는 사용 가능합니다. 댓글에 올려주신 DOTA 데이터셋으로 학습한 pretrained model은 사용 가능합니다. 실제로 
베이스라인도 DOTA pretrained weight를 사용하고 있습니다.

3. pretrained weight를 재학습해서 사용하는 것은 제한됩니다. 이는 오해의 소지가 있을 것 같은데, 기준은 모델 학습시 불러오는 weight의 출처로 봐주시면 될 것 같습니다. backbone 의 weight를 불러오는(다운받는) URL이 공인된 URL 이어야 합니다.(imagenet, dota, etc) 모델 구현 시 이 사항에 대하여 체크하며 pretrained model에 대한 정합성 또한 검증합니다. 

감사합니다.

우디
2020.10.21 19:18

깔끔한 정리 감사합니다! 도움이 많이 되었습니다 :]

JHKang
2020.10.23 13:13

삭제된 댓글입니다