분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[데이콘 답변 요청] 재현성 관련 질문있습니다.
train코드가 gpu로인해 재현이 불가능해도 추론코드로 저장되있는 모델 불러와서 최종제출물이 재현이 되면 괜찮은건가요?
학습했을때의 모델을 추론코드에서 로드하여 추론했을 때 재현이 된다면 재학습 했을 때 gpu로 인한 약간의 오차는 감안한다는말씀이실까요?
네. 위에서 말씀드린 랜덤 요소에 대비한 것들만 잘 준비하여 진행한다면 재현에 문제 없습니다.
혹시 추가로 시퀀스피쳐 처리할때마다 너무 오래걸려서 데이터전처리를 다시 진행해서 만든 데이터셋을 사용하고있는데 최종제출물을 제출할 때 이 데이터셋을 같이 제출해도되는지 질문드립니다.
네 전처리된 데이터셋을 동봉하셔도 문제는 없으나, 원본 데이터셋에서 동봉한 전처리된 데이터셋을 재현할 수 있는 코드도 같이 제출해야합니다.
그럼 제출할땐 전처리된 데이터셋, 사용된 모델 가중치, 전처리 데이터셋에 대한 코드, 훈련코드, 추론코드 총 다섯가지 제출하면 되나요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
보통 재현 평가는 '재학습'을 진행하여 추론한 결과를 바탕으로 확인합니다.
랜덤 요소로 인해 100% 동일한 결과를 재학습으로 재현되기는 어려울 수 있으나, 그 오차 범위를 줄일 수 있도록
랜덤 시드 고정, 설치 패키지 버전(requirements.txt), 개발 환경 기재 등을 포함하여 코드를 제출합니다.