데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
갑상선암 진단 분류 해커톤 : 양성과 악성, AI로 정확히 구분하라!
public/private shake-up 관련 데이터셋 비판
여러분 대회 고생 많으셨습니다.
public/private 결과를 보시면
갑갑한 점이 많으리라 생각합니다.
입문 대회 특성상 그냥 넘어가도 되는 문제이기도 하지만,
대회가 간절한 사람 입장에서는 Daycon에 충분히 불만을 가질만한 사항이라고 생각합니다.
구체적으로 public/private 모두 동일 score가 많다는 점에서
데이터셋에 분명 문제가 많습니다.
사실 입상하신 분도 뛰어난 알고리즘이나 방법론을 적용해 입상하신 것인지 다소 의문이 듭니다.
여러분은 어떻게 생각하시나요?
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
저같은 경우 그냥 범주형 변수만 몇 개 선정해서 catboost 실행한 모델로 제출했습니다. 데이터 살펴보니 shake up이 심할 것 같았고, 여러 방법론 써봤지만 성능 개선이 미미했습니다. 비록 수상은 못했지만, 큰 불만은 없습니다. 데이터에 따라 오히려 단순한 방법론을 적용하는게 유리한 경우들이 적지 않고, 무엇보다 그냥 입문 대회일 뿐이니까요..수상하신 분들은 어떤 방법을 쓰셨을지 궁금하긴합니다 ㅎㅎ