DASCHOOL! Fall Special Discount
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
2025 Samsung Collegiate Programming Challenge : AI 챌린지
모델 사용 관련 질문
instructblip-flan-t5-xl 모델을 사용하여도 된다는 질문글을 확인하고 이 모델을 사용하였는데 파라미터 수가 약 4.02B인데도 사용 가능한건지 질문드립니다
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
4) 추론 모델 가중치의 총합은 '3B' 미만
리더보드에 제출하는 예측 결과는 아래 조건을 반드시 충족해야 합니다.
🔹추론에 사용되는 모든 모델의 총 파라미터 수는 반드시 3B(30억 개) 미만이어야 합니다.
🔹이 기준은 추론 코드에서 실제로 로드(Load)되는 모든 모델의 가중치(parameter)의 수 합계를 기준으로 판단합니다.
※ 예시: 2B 모델 10개를 순차적으로 로드하여 각각 추론 후 메모리에서 제거하더라도, 추론 과정에서 총 10개의 모델 가중치가 각각 로드되므로 총합 20B로 규칙 위반에 해당합니다.
추론 규칙에 유의하여 사용하시면 되겠습니다.