원자력발전소 상태 판단 경진대회

데이터 관련 질문입니다.

2020.01.16 19:59 3,393 조회

비식별화된 변수들에 대해서는 따로 설명이 가능한가요?

가능하다면 어디서 확인할 수 있을지 궁금합니다.


그리고 라벨이 의미하는 바를 잘 모르겠습니다.

id 0의 라벨이 110인데요

0.csv에서는 599초까지 초마다 라벨이 정해져있고

600초가 됐을 때의 라벨이 110인건가요?

아니면 599초동안 바뀐 변수들에 대한 라벨이 110인건가요?

로그인이 필요합니다
0 / 1000
DACON.토니
2020.01.16 21:01

안녕하세요 세깃님.

1. 비식별화된 변수에 대해서는 따로 설명이 불가합니다. 

2. 주어진 데이터에서, 0초에서 15초 사이에 상태_A에서 상태_B로 변경이 이루어집니다. 이 때, 상태_B에 대한 라벨이 110입니다. 
예를 들어 7초에 상태 변화가 이루어 졌다고 가정하면, 7초 부터 599초에 해당되는 row의 라벨 값이 110 입니다. 

감사합니다. 

youngs
2020.01.17 11:52

그럼 7초 부터 599 초 안에는 변화가 일어나지 않는다는 얘기인가요?
아니면 7초 부터 599초 안에 어떤 변화가 일어나도 row 의 라벨값은 처음 변화가 일어났던 7초 Label 값만 본다는건가요?

DACON.kn
2020.01.17 12:08

youngs님 안녕하세요.
7초에 상태가 바뀐 경우 이루어 진 경우 0~6초: 상태_A, 7초 이후: 상태_B 입니다. 
train, test 데이터 내에서 상태는 한번만 변하며 label은 상태_B를 의미합니다. 

공식적으로는 row에 라벨을 붙여드리지는 않았지만 위 예시를 기준으로 설명드리면
0~6초 : label 없음
7초 ~ : 110 (상태_B의 라벨)
로 할 수 있습니다.

감사합니다:)