주차수요 예측 AI 경진대회

private 결과에 대해

2021.07.30 21:55 4,919 조회

데이콘은 public과 private의 차이를 보니 어떤 생각이 드시나요? public 최상위권분들의 노력은 무슨 의미가 있었을까요?  좋은 결과를 기록한 분들의 노력을 폄하하는게 아닙니다. 그분들의 수상을 반대하는것도 아닙니다.


한국토지주택공사 빅데이터센터는 왜 600개도 안되는 데이터도 제대로 관리 못하면서, 무슨 자신감으로 1300만원을 상금으로 걸었을까요? 국민 세금이 장난으로 보여서 그런건지, 아니면 담당자가 부동산으로 돈을 너무 벌어서 1300만원과 1300원을 구분 못하신건지요?


빅데이터센터는 당장 tiny 데이터센터로 이름을 바꾸고 담당자가 이 대회의 개최목적이 무엇이었는지, 이변 우승자 코드를 어떻게 활용해 긍정적인 주택 정책을 수립할 것인지 명확히 설명해야 합니다. 그게 이딴 수준의 데이터로 뭐라도 예측해보겠다고 시간 쏟아부은 참가자들과, 세금낸 국민들에 대한 최소한의 예의입니다.


남의돈이라고 함부로 쓰지마세요

로그인이 필요합니다
0 / 1000
건조한안구는싫어
2021.07.30 22:09

데이터가 문제가 있는 데로 진행한 것은 아쉽게 생각합니다. 

하지만 private과 public 차이는 그 누구의 잘못도 아닌 것 같습니다.

춘식
2021.07.31 10:42

private과 public의 차이는 조금 아쉽게 생각되긴 합니다.

일단은 대회를 진행함에 있어서 public스코어를 개선하는 방향으로 모델을 발전시킬수 밖에없는데

애초에 데이터셋의 크기를 보고 overfitting을 고려했어야 한다고 생각은 하지만 너무 차이가 나버리네요.

대회 진행하시면서 다들 고생많으셨습니다!

HJOK
2021.07.31 19:25

어느정도 예견된 결과이고 도박을 한거죠. 데이터셋이 적고 노이즈가 많고 (애초부터 처음에는 오류가 있었고)
데이터를 분석했을때 운빨 대회가 될 것인건 누구나 생각해볼만하고  대회를 그만둘 판단을 하는게 괜찮은 판단인 것 같네요. 

구웅
2021.11.17 16:49

삭제된 댓글입니다

교수꿈나무
2021.08.10 22:28

현실성을 위해 private 점수에 근거하여 수상을 한것 같긴한데 솔직히 public 점수를 올리기 위해 노력하는 사람들에겐
public과 private 점수 차이는 너무 허탈한것 같아요.. 다른 대회에서도 그렇고 최상위권 선수가 하위권으로 내려가는 모습이 종종나오는데
데이콘 측에서 최종 점수 산정 시 public 점수를 조금이라도 포함시켜 점수를 산출하는 것이 좋다고 생각이 드네요

1. private 평가시 public 데이터를 같이 포함시켜 최종 점수 산출
2. public 점수 30%, private 점수 70% 하여 최종 점수 산출

이런식으로 점수를 도출한다면 좋겠지만.. 아쉽네요