분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
2025 Samsung Collegiate Programming Challenge : AI 챌린지
사용가능 모델에 대한 질문이 있습니다.
1- 데이터 증강 및 라벨링이나 아니면 가이던스 과정에서도 외부 api가 사용이 불가능한가요?
예를들어, 실제 추론과 무관한 학습 과정에서도 외부 api가 아니라 오픈소스 모델만이 사용가능한지 궁금합니다.
2- 단일 모델만이 사용가능하며, 앙상블은 불가능하다고 하셨는데, 예를 들어 파이프라인을 쪼개 2개 모델을 순차적으로 사용할 경우,
이 두 모델의 파라미터를 합쳐 3b 미만이어도 사용이 불가능한 것인지, 아니면 모델이란 파이프라인 전체를 이르는 하나의 단일 모델을 가리키는
것이므로 앙상블과 같은 형태가 아니면 파이프라인을 쪼개도 괜찮은 것인지 궁금합니다.
3- 모델의 총 파라미터는 원본 모델을 기준으로 하는 것인지, 아니면 최종 추론 단계에서 사용되는 파라미터의 수가 기준인지 궁금합니다. (실 사용시 들어가는 메모리가 기준인 것인지 궁금합니다.)
답장 감사합니다. 그럼 2의 경우 최종 출력(추론결과)을 재사용하는 재귀 형태의 모델 구성이 아니라 END TO END 최종 출력을 출력하는 2STAGE 모델의 경우 허용된다 라고 생각해도 될까요? 예를 들어 TOT(Tree of thought)와 같은 형태로 이전 결과를 재사용 하되 그 재사용하는 결과가 최종출력이 아닌 경우, 또는 이미지와 관련된 모델 A와 추론 모델 B와 같은 형태는 괜찮은지 궁금합니다.
네, 말씀하신 형태처럼 중간 출력을 외부로 분리하지 않고, End-to-End로 하나의 모델 안에서 처리되는 2-Stage 구조라면 허용됩니다.
TOT(Tree of Thought)처럼 이전 결과를 내부적으로 재사용하더라도 최종 출력이 단일 호출로 생성되는 구조라면 단일 모델로 간주됩니다.
단, 중간 출력을 저장하거나 별도 추론에 사용하는 구조는 허용되지 않습니다.
삭제된 댓글입니다
답장 감사합니다. 중간 출력을 저장하거나 별도 추론에 사용하는 구조가 안 와닿는데, 이 부분에 대한 예시나 설명을 부탁드려도 될까요?
앙상블 관련하여 https://dacon.io/competitions/official/236500/talkboard/414112?page=1&dtype=recent
해당 안내글에서 규칙이 개정되었으니 반드시 참고 부탁드립니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
1)
네. 모든 과정에서 대회 규칙이 적용됩니다.
2)
단일 모델만 허용된다는 의미는, 전체 예측 과정이 하나의 모델 구조로 통합되어 있고, 추론이 단일 호출로 이루어져야 한다는 뜻입니다.
A → B와 같은 2-Stage 구조도, 전체가 하나의 모델로 구성되어 있고 end-to-end 학습 및 단일 추론 흐름으로 작동한다면 허용됩니다.
그러나 A와 B가 서로 다른 백본을 사용하거나, A 모델이 독립적으로 추론한 결과를 B 모델(다른 백본)의 입력과 원 입력에 결합하여 최종 예측에 사용하는 구조는,
두 개의 독립된 추론 경로가 존재하는 다중 모델 추론 방식으로 간주되며, 겉으로 단일 호출처럼 구현되었더라도 앙상블로 판단되어 허용되지 않습니다.
즉, 단일 호출 여부만으로 판단하지 않으며, 모델 구조 내에서 복수의 백본이 각각 추론을 수행하고 결과에 영향을 주는 경우는 규칙 위반입니다.
3)
모델의 총 파라미터 수는 제출된 추론 코드에서 로드되는 전체 모델 가중치(parameter)의 수를 기준으로 하며, 반드시 3B 미만이어야 합니다.