치팅과 관련해서 데이콘에서 이메일을 받았습니다.

팔당댐 홍수 안전운영에 따른 한강 수위예측 AI 경진대회

Statistics

2022.08.17 15:56 1,921 Views

방금 데이콘에서 아래와 같은 이메일을 받았습니다.

데이콘에서 정의하는 제출과 관련된 치팅은 "인간이 예측한 값, 검색 등을 통한 수기 작성 등의 제출"입니다.

이번 대회에서 문제가 되는 부분은 시점에 따른 Leakage이고요.

지금까지 공유, 공지된 내용으로 Leakage의 경우 패널티는 없고, Leakage 활용시 최종 평가에서 실격처리됩니다.

제 스코어가 높았던 이유는 이틀 동안 파라미터 튜닝하고 테스트하기 위해서 스크립트를 작성하는 과정에서 shift(lead)하지 않은 target 변수를 지정해서 입니다.

당연히 평가 과정에서 실격 사유에 해당하지만, 코드를 통해서 재현이 가능하므로 치팅에는 해당하지 않습니다.

이 대회는 다른 대회와 달리 시점의 문제, 외부데이터를 통한 정답 확인 가능이라는 점에서 운영이 쉽지 않다는 것을 이해합니다.

그러나 평가 대상자 선정 방법 등이 공지되지 않아 모호한점이 많았고, 저는 질문을 통해 명확하게 짚고가려고 했습니다.

그런데 데이콘은 Leakage는 실격 사유에 해당하지만 패널티는 없다고 했고, 다른 참여자의 "리더보드 초기화" 요청에는 불가능하다고 답을 했습니다.

대회 초기에 참여자가 몰리는 특성상 리더보드 초기화시 참여자 수가 급감할 것이기 때문이라고 뇌피셜 돌려봅니다.

저는 이왕 이렇게 된 거 지금이라도 전체 리더보드 초기화 혹은 이메일에서 등장하는 "데이콘의 재현가능한 스코어의 스케일"이상의 랭커의 리더보드 초기화를 주장합니다.

제출된 스크립트에 대한 치팅 여부 답장을 받으면 결과를 다시 공유하겠습니다.

Comments 4개

로그인이 필요합니다

comment

0 / 1000

hahaha

2022.08.17 17:25

삭제된 댓글입니다

Statistics

2022.08.17 20:16

대회 담당자분과 긴(?)통화를 했습니다.
코드를 제출했고, 코드에서 Train과 Test(2022년 6월, 6월)이 명확하게 구분되어 있고 Train 안에서 Target에 10분 시차를 적용하지 않아서 생긴 문제라는 것을 확인했습니다.
대회 규칙에서 정의한 Leakage 규정에 따라 검증/평가 데이터가 학습에 사용된 것이 아니므로 실격 대상은 아닌 것이 확인되었고 다행히 실격은 면했습니다.

전화 통화를 통해, 내부 방법론에 따라 판단한 결과 지금 리더보드 스코어는 모두 문제없고 따라서 리더보드 초기화 계획도 없다는 것을 확인했습니다.

제 경우를 보면 모형 적합 과정에서 10분 시차 미적용자체가 실격사유는 아니지만, 평가과정에서는 엄격하게 검토예정이라고 합니다.

Python이나 R에서 이동평균 등을 계산할 때 보통 기본값 설정을 따르면 되고, shift 등도 기본값을 따르면 문제 없습니다.
그런 다음 마지막에 target 변수인 wl_xxxxxxx 등만 lead로 한 칸 당기는(lead) 방법을 활용하는 것이 좋겠습니다.

아무튼 살아남아서 너무 행복합니다. 감사합니다.