분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
갑상선암 진단 분류 해커톤 : 양성과 악성, AI로 정확히 구분하라!
public/private shake-up 관련 데이터셋 비판
여러분 대회 고생 많으셨습니다.
public/private 결과를 보시면
갑갑한 점이 많으리라 생각합니다.
입문 대회 특성상 그냥 넘어가도 되는 문제이기도 하지만,
대회가 간절한 사람 입장에서는 Daycon에 충분히 불만을 가질만한 사항이라고 생각합니다.
구체적으로 public/private 모두 동일 score가 많다는 점에서
데이터셋에 분명 문제가 많습니다.
사실 입상하신 분도 뛰어난 알고리즘이나 방법론을 적용해 입상하신 것인지 다소 의문이 듭니다.
여러분은 어떻게 생각하시나요?
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
저같은 경우 그냥 범주형 변수만 몇 개 선정해서 catboost 실행한 모델로 제출했습니다. 데이터 살펴보니 shake up이 심할 것 같았고, 여러 방법론 써봤지만 성능 개선이 미미했습니다. 비록 수상은 못했지만, 큰 불만은 없습니다. 데이터에 따라 오히려 단순한 방법론을 적용하는게 유리한 경우들이 적지 않고, 무엇보다 그냥 입문 대회일 뿐이니까요..수상하신 분들은 어떤 방법을 쓰셨을지 궁금하긴합니다 ㅎㅎ