Aimers 8기 : 모델 경량화 온라인 해커톤

LG Aimers | 채용 | 알고리즘 | LLM | 코드제출 | 경량화

  • moneyIcon 본선 진출
  • 1,538명 마감
마감

 

MODEL_ID에 따른 성능 차이

2026.02.22 06:45 853 조회

Setting

데이콘에서 받은 모델, MODEL_ID = "./base_model" 과 허깅페이스에서 불러와서 쓴 모델 MODEL_ID = "LGAI-EXAONE/EXAONE-4.0-1.2B"의 성능차이가 있을까요? 같은 모델인데 용량이 좀 다른거 같아서요


MODEL_ID = "./base_model"     
OUT_DIR  = "./model"          

DATASET_ID = "LGAI-EXAONE/MANTA-1M"
DATASET_SPLIT = "train"

NUM_CALIBRATION_SAMPLES = 256
MAX_SEQUENCE_LENGTH = 512

# Quantization
SCHEME = "W4A16"
TARGETS = ["Linear"]
IGNORE  = ["embed_tokens", "lm_head"]
로그인이 필요합니다
0 / 1000
DACON.PSH
2026.02.23 10:06

2. 대회 규칙에 명시된 허깅페이스 링크의 모델과 동일한 모델입니다.