분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
난임 환자 대상 임신 성공 여부 예측 AI 온라인 해커톤
shake up
일단 모두들 수고하셨습니다~
imbalance data이다보니 shake up이 클 것이라 예상하고 준비했는데
다른 방향으로 준비 한 것 같아서 개인적으로는 아쉽습니다.
다들 어떤 식으로 데이터 처리하셨는지 궁금하네요.
소중한 경험 공유해주셔서 감사합니다.
1위 축하드립니다.
저도 불균형 데이터셋<--여기에 초점을 두고 개선을 진행했었는데 생각했던 것 보다 성능이 크게 향상되는 것 같진 않더라고요..그래서 최대한 데이터 내의 클래스 분포에 집중해서 모델튜닝을 진행했던 것 같습니다. 이번에 좋은 경험한 것 같고 다들 고생 많으셨습니다!
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Imbalance의 경우에는 고려하지 않았습니다. 평가지표가 AUC인 만큼, 클래스 불균형에 대한 고려는 뒷전으로 미룬거 같습니다.
약 3:1정도의 Imbalance여서, 그렇게 크지도 않구요.
도중 LG에서 발표해주신 AGATa나 SMOTE, RANDOM, ADASYN등 다양한 오버샘플링 방식을 고려한적은 있으나, 큰 효과를 보진 못한거 같습니다.
그나마 Random OverSampling의 경우가 나았네요. 딥러닝의 경우 AGATa는 효과가 있었습니다.