HAI(하이)! - Hecto AI Challenge : 2025 하반기 헥토 채용 AI 경진대회

모델 질문이 있습니다.

2025.12.25 17:38 1,145 Views

안녕하세요.

모델 규칙에 잘 모르겠는 부분이 있습니다.

  • 허용 부분: 단일 백본(backbone)으로부터 추출된 feature를 기반으로 한 head 확장 또는 auxiliary head 구성
  • 불허 부분: 복수의 모델 또는 백본(backbone)을 병렬로 결합하는 구조

예를들어 서로 다른 역할을 하는 인코더를 결합하는게 "복수의 모델 또는 백본(backbone)을 병렬로 결합하는 구조"에 해당하는 것일까요?

사실 어디까지가 백본인지 잘 모르겠습니다. 입력 데이터를 여러 특성으로 분리해서 동일한 형태의 임베딩으로 만들어 붙이고 처리하면 허용 부분일까요?

그리고

  • 영상(Video) 데이터의 경우 프레임 단위로 분해하여 각 프레임을 개별 이미지로 모델에 입력해야 하며, 복수 프레임을 동시에 모델 입력으로 사용하여 시간적 정보를 직접 활용하는 방식은 허용되지 않습니다.
  • 단, 프레임별로 독립적으로 수행된 추론 결과를 종합하여 최종 결과를 산출하는 후처리 과정은 허용됩니다.

이 부분에서도 시계열적인 특성을 활용하는 방식은 허용되지 않는다고 적혀있는데, 여기서 잘 모르겠는것이 각 프레임을 잘라 각각 처리 후 결합하는 것은 시간적 정보를 처리하는것이 아니라고 말할 수 있는지 모르겠습니다.

그리고 프레임별 독립적인 수행 추론 결과라고 하는것은 이진 분류된 결과를 말씀하시는 걸까요? 그러면 투표방식이 있을거같은데 그외에는 로짓 가중합 방식 말고는 떠오르지 않습니다. 제가 이해한게 맞을까요?

그런데,

  • 서로 독립적으로 학습된 모델의 예측 결과 또는 임베딩을 결합하는 방식
  • Test-Time Augmentation(TTA) 등 반복 추론 후 결과를 결합하는 방식

이 불허 조건에 따르면 반복 추론 결과를 결합하는 방식, 모델의 예측 결과를 결합하는 방식이랑 말이 안맞는데 동영상인 경우에는 예외인건가요?

Login Required
0 / 1000
DACON.GM
2025.12.29 09:14

서로 다른 인코더를 병렬로 결합하여 각각 독립적인 feature를 생성·결합하는 구조는 복수의 백본(backbone)을 사용하는 것으로 판단되어 허용되지 않습니다. 
반면, 하나의 단일 백본을 공유하고 head 확장 또는 auxiliary head 형태로 처리하는 구조는 허용됩니다. 

영상 데이터의 경우 각 프레임은 완전히 독립적인 이미지 입력으로 처리되어야 하며, 모델 내부에서 프레임 간 순서나 관계 등 시간적 정보를 직접 학습하는 방식은 허용되지 않습니다. 
다만 프레임별로 독립적으로 수행된 추론 결과를 모델 외부에서 평균, 투표, 가중합 등의 방식으로 종합하는 후처리는 허용되며, 이는 동일 입력에 대한 반복 추론 결과를 결합하는 TTA나 모델 앙상블과는 다른 경우로 규칙 위반에 해당하지 않습니다.