Aimers 8기 : 모델 경량화 온라인 해커톤

LG Aimers | 채용 | 알고리즘 | LLM | 코드제출 | 경량화

본선 진출
1,537명 마감

마감

대회안내 데이터 코드 공유 토크 리더보드

제출

MODEL_ID에 따른 성능 차이

seopseopi

2026.02.22 06:45 1,045 조회

Setting

데이콘에서 받은 모델, MODEL_ID = "./base_model" 과 허깅페이스에서 불러와서 쓴 모델 MODEL_ID = "LGAI-EXAONE/EXAONE-4.0-1.2B"의 성능차이가 있을까요? 같은 모델인데 용량이 좀 다른거 같아서요

MODEL_ID = "./base_model"     
OUT_DIR  = "./model"          

DATASET_ID = "LGAI-EXAONE/MANTA-1M"
DATASET_SPLIT = "train"

NUM_CALIBRATION_SAMPLES = 256
MAX_SEQUENCE_LENGTH = 512

# Quantization
SCHEME = "W4A16"
TARGETS = ["Linear"]
IGNORE  = ["embed_tokens", "lm_head"]