토스 NEXT ML CHALLENGE : 광고 클릭 예측(CTR) 모델 개발

알고리즘 | 채용 | 토스 | 정형 | CTR | 머신러닝 | 분류

  • moneyIcon 상금 : 1,000 만원
  • 1,722명 종료까지 D-30

 

[데이콘 답변 요청] 재현성 관련 질문있습니다.

2025.09.10 14:16 551 조회

train코드가 gpu로인해 재현이 불가능해도 추론코드로 저장되있는 모델 불러와서 최종제출물이 재현이 되면 괜찮은건가요?

로그인이 필요합니다
0 / 1000
DACON.GM
2025.09.10 14:37

보통 재현 평가는 '재학습'을 진행하여 추론한 결과를 바탕으로 확인합니다.
랜덤 요소로 인해 100% 동일한 결과를 재학습으로 재현되기는 어려울 수 있으나, 그 오차 범위를 줄일 수 있도록
랜덤 시드 고정, 설치 패키지 버전(requirements.txt), 개발 환경 기재 등을 포함하여 코드를 제출합니다.

해가울면해운대
2025.09.13 01:07

학습했을때의 모델을 추론코드에서 로드하여 추론했을 때 재현이 된다면 재학습 했을 때 gpu로 인한 약간의 오차는 감안한다는말씀이실까요?

DACON.GM
2025.09.10 16:16

네. 위에서 말씀드린 랜덤 요소에 대비한 것들만 잘 준비하여 진행한다면 재현에 문제 없습니다.

해가울면해운대
2025.09.11 02:05

혹시 추가로 시퀀스피쳐 처리할때마다 너무 오래걸려서 데이터전처리를 다시 진행해서 만든 데이터셋을 사용하고있는데 최종제출물을 제출할 때 이 데이터셋을 같이 제출해도되는지 질문드립니다.

DACON.GM
2025.09.11 12:53

네 전처리된 데이터셋을 동봉하셔도 문제는 없으나, 원본 데이터셋에서 동봉한 전처리된 데이터셋을 재현할 수 있는 코드도 같이 제출해야합니다.

해가울면해운대
2025.09.12 05:24

그럼 제출할땐 전처리된 데이터셋, 사용된 모델 가중치, 전처리 데이터셋에 대한 코드, 훈련코드, 추론코드 총 다섯가지 제출하면 되나요? 

이전 글
이전 글이 존재하지 않습니다.
현재 글
[데이콘 답변 요청] 재현성 관련 질문있습니다.
대회 - 토스 NEXT ML CHALLENGE : 광고 클릭 예측(CTR) 모델 개발
좋아요 6
조회 551
댓글 6
3일 전
다음 글
범주형 변수에 대한 정보 공유
대회 - 토스 NEXT ML CHALLENGE : 광고 클릭 예측(CTR) 모델 개발
좋아요 17
조회 291
댓글 2
하루 전