갑상선암 진단 분류 해커톤 : 양성과 악성, AI로 정확히 구분하라!

public/private shake-up 관련 데이터셋 비판

2025.07.01 00:36 416 조회

여러분 대회 고생 많으셨습니다.


public/private 결과를 보시면

갑갑한 점이 많으리라 생각합니다.


입문 대회 특성상 그냥 넘어가도 되는 문제이기도 하지만,

대회가 간절한 사람 입장에서는 Daycon에 충분히 불만을 가질만한 사항이라고 생각합니다.

구체적으로 public/private 모두 동일 score가 많다는 점에서

데이터셋에 분명 문제가 많습니다.

사실 입상하신 분도 뛰어난 알고리즘이나 방법론을 적용해 입상하신 것인지 다소 의문이 듭니다.

여러분은 어떻게 생각하시나요?


로그인이 필요합니다
0 / 1000
Staty
2025.07.01 15:07

저같은 경우 그냥 범주형 변수만 몇 개 선정해서 catboost 실행한 모델로 제출했습니다. 데이터 살펴보니 shake up이 심할 것 같았고, 여러 방법론 써봤지만 성능 개선이 미미했습니다. 비록 수상은 못했지만, 큰 불만은 없습니다. 데이터에 따라 오히려 단순한 방법론을 적용하는게 유리한 경우들이 적지 않고, 무엇보다 그냥 입문 대회일 뿐이니까요..수상하신 분들은 어떤 방법을 쓰셨을지 궁금하긴합니다 ㅎㅎ