원자력발전소 상태 판단 경진대회

알고리즘 | 정형 | 회귀 | 산업 | Log Loss

  • moneyIcon 상금 : 1,000만원
  • 1,398명 마감

 

Label 관련 문의입니다.

2020.01.22 18:18 2,389 조회

데이터  설명을 확인하면 아래와 같이 설명되어 있습니다.



데이터 설명


  • 모사 데이터는 0초에서 15초 사이에 상태가 변하기 시작합니다. 모든 데이터가 숫자로 이루어져 있습니다. 
  • 반면 실제 데이터는 10초에 상태가 변하기 시작합니다. 



또한, 코드 공유에 올라온 data_loader에서 예제로 주신 코드에는 event_time =10으로 설정되어 있습니다.


train 데이터실제 데이터여서 10초에서 상태 변화가 이루어지는 것인지, 아니면 모사 데이터이므로 0초에서 15초 사이에 랜덤하게  상태 변화가 이루어 진 것인지 궁금합니다.


로그인이 필요합니다
0 / 1000
nagne
2020.01.22 18:27

데이터 설명에 따르면 실제 데이터는 문자열이 포함되어 있어요.
제가 찾은 실제 데이터를 정리해서 400161번 토론 실제 데이터 파일에 정리했습니다. 참고하시면 좋을 것 같아용 

DACON.kn
2020.01.22 18:35

안녕하세요. 존재하는닉네임님.
질문 감사드립니다.

train 데이터 내에는 모사 데이터와 실제 데이터가 같이 포함되어 있습니다.
마찬가지로 test 데이터도 모사 데이터와 실제 데이터를 포함합니다.
해당 내용에 대해 많은 분들이 문의를 주셔서 B. 파일 설명에 해당 대용을 추가하였으니 참고바라겠습니다.

감사합니다:)