분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Remind] 대회 규칙 관련 상세 설명
안녕하세요. HD현대 AI Challenge 참가자 여러분.
대회가 시작된 지 약 2주일이 되어가는 시점에서 대회 규칙 관련 Remind 안내를 재차 드립니다.
참가자 여러분들께서는 다시 한번 규칙을 확인하시어, 대회 결과에 불이익이 받는 일이 없도록 반드시 유의 부탁드립니다.
해커톤(경진대회) 특성 상, 리더보드 제출을 위해 추론에 사용될 test 데이터들이 사전에 주어지지만, 실제 모델을 서비스하는 환경에서는 test 데이터들이 어떠한 데이터들이 몇개가 입력으로 들어올 지 전혀 알 수 없습니다.
따라서 해커톤(경진대회) 역시, Test 데이터들을 '전혀 알 수 없고, 볼 수 없다' 라고 가정하고 진행해야합니다.
대표적인 Data Leakage에 해당하는 사례
대표적인 Data Leakage에 해당하지 않는 사례
사용에 법적 제약이 없으며, 누구나 변경, 재배포할 수 있는 공개된 외부 데이터 사용 가능
법적 제약이 없으며 논문으로 공개된 베이스의 사전 학습 모델(Pre-trained Model) 사용 가능
모든 학습, 추론의 과정 그리고 추론의 결과물들은 정상적인 코드를 바탕으로 이루어져야하며, 비정상적인 방법으로 얻은 제출물들은 적발 시 규칙 위반에 해당됩니다.
[중요] 제공한 학습 데이터로부터 모델 학습의 과정이 필수적으로 존재해야함
감사합니다.
Test 데이터를 학습에 사용하지 않았으니 상관없을 겁니다..!
감사합니다:)
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Test 데이터에서 2개 이상의 특성을 통한 파생 변수를 만드는 대신 독립적인 샘플(행(row)) 내에서의 모든 연산 혹은 파생 변수 생성시에는 아무 문제가 없다고 이해해도 될까요?