Public vs. private 등수?

2020.08.24 12:16 3,458 Views

데이콘 대회에선 위 두 등수가 어떻게 매겨지나요?  구글 검색 후 머리 속에 정리한 내용을 아래 적어 놓습니다.


Kaggles 사이트 설명:


1) 따로 준비한 데이터셋을 무작위로 나누어 그 30%를 활용해 퍼블릭 등수 결정


2) 나머지 70%로 프라이빗 등수 결정. 대회가 끝날 때까지 비밀^^


3) 퍼블릭 등수로 리더보드(Leader Board)에 발표함.  참가자는 이 랭킹을 보고 자기 모델의 일반적인 정확성을 '대충' 파악함.


4) 프라이빗 등수는 참가자가 최종선택한 2개의 모델의 성능으로 결정하고 최종대회 랭킹이 결정.


5) 이렇게 나눈 이유는...  퍼블릭 데이터셋에 오버피팅된 모델이 상위 랭킹되는 걸 방지하면서, 동시에 참가자들이 일반 데이터에 성


능이 뛰어난 모델을 만들도록 유도하기 위함 (잘 준비된 데이터셋 한계를 극복할 수 있도록?).


로그인이 필요합니다
0 / 1000
DACON.토니
2020.08.25 14:50

안녕하세요 Jasonk님.

1) 데이콘 또한 동일, 단 퍼센트 비율은 대회 별 상이

2) 데이콘 또한 동일, 단 퍼센트 비율은 대회 별 상이

3) 데이콘 또한 동일

4) 데이콘은 최종선택한 1개 모델의 성능으로 Private 등수를 산출

5) 데이콘 또한 동일

감사합니다.