데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
예측이후, 음수처리
모델을 트레이닝하고, 예측하여 예측 가격이 음수가 나올 경우, 0으로 처리해서 제출해도 되나요?
아니면 원본 그대로 음수가 존재한 결과로 제출해야하나요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요 전북대식유대학원생님.
가격산출시 거래취소내역(음수로 집계)은 반영하지 않고있습니다.
('코드 공유' - 'AT_TSALET_ALL 파일 전처리 코드' 참고)
(# 날짜별, 품목별, 거래량이 0 이상인 행만 선택)
c = tsalet_sample[(tsalet_sample['SALEDATE']==day) & (tsalet_sample['PUM_NM']==sub) & (tsalet_sample['TOT_QTY']>0)]
때문에 train set 생성시 음수인 데이터는 포함이 되지 않고, 이를 학습한 모델 역시 음수값을 예측값으로 내놓지 않을 것입니다.
만약 이와 다르게 전처리를 하셔서 train set에 음수가 포함되어있다면, 추가적으로 음수 데이터 제거 작업을 해주시는 게 좋을 것 같습니다.
참고로 Score 채점시 정답 가격이 0인 데이터는 제외하고 채점됩니다.
(대회안내 - 규칙 - 평가 - 1차 평가 - 평가산식 코드 참고)
target_idx = np.where(answer!=0)
즉, 실제 시장 거래가 없는 일요일, 공휴일 등의 경우는 자동으로 Score 산정 과정에서 제외됩니다.
따라서 제출하실 정답지에 의도적으로 0을 채워넣을 필요는 없습니다.
감사합니다.
데이콘 드림.