분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
HD현대 AI Challenge
데이터 적법성에 관련한 유사내용
안녕하세요
대회참가자입니다.
유가관련하여 데이터 적법성에 관하여 Train데이터가 수정된것으로 알고있습니다
이것은 미래의 데이터를 알고 있기때문에 그것을 추정해서 정답지와 근사한 값을 추출할 수 있는 것으로 알고 있습니다.
그것을 토대로 풍량과 온도에 관해서도 미래시간에 대한 데이터로 알고있습니다.
유가와 유사하게 일부 결측치가 있지만 결측지를 제외한 나머지 데이터를 학습하였을때 좋은 결과가 나오는것으로 확인하였습니다.
이 부분에 대해서도 확인부탁드립니다.
감사합니다.
삭제된 댓글입니다
답변감사합니다
유가 정보를 제외할 본 대회에서 제외할 때 대기 종료 시점을 추정할 수 있는 정보를 담고 있어, 현실적으로 사용이 불가능한 데이터이며 실제 프로젝트를 진행하고 있는 팀에서도 사용하지 않고 있는 상황입니다. 라는 답변과 함께 제외한 후 진행하였는데 그렇다면 유가 데이터를 제외하지 않아도 되지 않았을까 조심스럽게 말씀드려 봅니다. 추가로 현재 유가 데이터도 제외를 했기 때문에 둘중 하나를 살려놓는 것은 본 대회에 맞지 않다고 생각이 되는데 어떻게 생각하지는지 궁금합니다.
준용_choi 님의 의견 반영하여 오전중에 데이콘 담당자 및 현업 담당자들과 논의하여 공지 드리도록 하겠습니다.
좋은 의견 감사드리며, 빠른 시간내로 결정하여 공지드리겠습니다.
답변 및 조치 감사드립니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
안녕하세요. HD현대 AI Center입니다.
먼저 대회에 관심 가지고 참여해주셔서 감사드리며, 문의 주신 내용에 대해 답변 드리겠습니다.
먼저 결론부터 말씀드리자면 저희가 제공 드린 기상 데이터는 관측소의 위치와 측정 시점에 따라 접안 시점에 가까운 시간대의 관측치를 가져올 수 있다는 점을 말씀드립니다. 이러한 이유는 기상 관측소에서 데이터를 수집할 때 일정 텀을 두기 때문에 발생하는 현상입니다.
저희가 제공 드린 기상 데이터는 전체 데이터 셋의 30% 수준이기에 대회 결과에 기상 데이터가 큰 요소로는 작용하지 못할 것으로 예상되지만, 그럼에도 불구하고 일부 제공 드린 이유는, 규칙 내에서 여러 외부정보를 활용할 수 있도록 독려하기 위함과 동시에 제한된 데이터에 대한 처리 역량을 확인하기 위함도 있었습니다.
본 대회는 실제 알고리즘을 현업에 적용하는데 목적이 아닌, 참가자들의 아이디어와 역량을 평가하는데 주된 목적이 있습니다. 대회에 제공 드린 데이터는 실제 현업에서 활용 되고있는 Feature외에 대회 취지를 바탕으로 real world에서는 적합하지 않은 정보들도 일부 존재할 수 있다는점 말씀드립니다.
따라서 제공된 기상 데이터는 미래 시점을 담고 있지 않다는 가정으로 진행해주시면 감사하겠습니다.
감사합니다.