15회 원자력발전소 상태 판단

  • 상금 : 총 1,000만원
  • 2020.01.16 ~ 2020.02.12 23:59
  • 816팀
  • D-17
참여

데이터 설명

* 20200122: 데이터 다운로드 불가 등 데이터 관련 문의는 전화 050-7135-80706 로 연락주시기 바랍니다.


A. 데이터 설명

본 대회에서는 한국수력원자력(주)에서 제공받은 원자력 발전소 모사 데이터 및 실제 데이터가 제공됩니다. 

주어진 데이터 내에서 발전소의 상태가 변하며 변하기 전 발전소 상태를 상태_A, 변한 후 상태를 상태_B라고 할 때 

데이터를 기반으로 상태_B를 판단하는 것이 대회의 목적입니다. 모든 데이터는 같은 상태 (상태_A)에서 시작합니다. 


모사 데이터는 0초에서 15초 사이에 상태가 변하기 시작합니다. 모든 데이터가 숫자로 이루어져 있습니다. 

반면 실제 데이터는 10초에 상태가 변하기 시작합니다. 실제 데이터에는 Bad, CLOSE, Equip Fail, No Data, Normal, OFF, ON, OPEN, System.Char[] 등 문자열 데이터를 포함하고 있으며 결측치가 있을 수 있습니다. 


훈련 데이터로는 약 10분 데이터가 주어지며 테스트 데이터로는 1분 간 데이터가 주어집니다. 즉 1분 데이터만 사용하여 평가합니다. 


B. 파일 설명

1. train.zip(9.81GB) : 훈련 데이터가 포함된 zip 파일입니다. 모사 데이터와 실제 데이터를 포함합니다. 

2. test.zip(879MB) : 테스트 데이터가 포함된 zip 파일입니다. 모사 데이터와 실제 데이터를 포함합니다.

   train.zip, test.zip 내 파일이름은 해당되는 고유한 번호 (id) 로 되어 있습니다. train과 test의 id는 중복되지 않습니다.

3. train_label.csv(6.78KB) : 훈련데이터의 id (파일 이름)에 해당되는 상태_B를 정리한 파일입니다. 

4. sample_submission.csv(283KB) : 제출 형식과 동일한 샘플 데이터 입니다.

5. additional_data.zip(13.9MB) : 실제 데이터 입니다. 

    additional data는 상태가 변하지 않습니다. 모든 시간에서 상태는 상태_A 입니다. 

    실제 데이터의 형식을 보여드리기 위해 참고자료로 주어지는 파일입니다. 컬럼은 train 및 test 데이터와 같습니다.


데이터 파일 컬럼에 대한 설명은 아래와 같습니다.

time : 발전소 운전 경과 시간 입니다. 단위는 초 입니다.

V0000~V5120 : 발전소 운영 중 측정되는 변수 입니다. 비식별화 되어 제공됩니다.