데이스쿨! 가을맞이 특별할인
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
난임 환자 대상 임신 성공 여부 예측 AI 온라인 해커톤
shake up
일단 모두들 수고하셨습니다~
imbalance data이다보니 shake up이 클 것이라 예상하고 준비했는데
다른 방향으로 준비 한 것 같아서 개인적으로는 아쉽습니다.
다들 어떤 식으로 데이터 처리하셨는지 궁금하네요.
소중한 경험 공유해주셔서 감사합니다.
1위 축하드립니다.
저도 불균형 데이터셋<--여기에 초점을 두고 개선을 진행했었는데 생각했던 것 보다 성능이 크게 향상되는 것 같진 않더라고요..그래서 최대한 데이터 내의 클래스 분포에 집중해서 모델튜닝을 진행했던 것 같습니다. 이번에 좋은 경험한 것 같고 다들 고생 많으셨습니다!
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Imbalance의 경우에는 고려하지 않았습니다. 평가지표가 AUC인 만큼, 클래스 불균형에 대한 고려는 뒷전으로 미룬거 같습니다.
약 3:1정도의 Imbalance여서, 그렇게 크지도 않구요.
도중 LG에서 발표해주신 AGATa나 SMOTE, RANDOM, ADASYN등 다양한 오버샘플링 방식을 고려한적은 있으나, 큰 효과를 보진 못한거 같습니다.
그나마 Random OverSampling의 경우가 나았네요. 딥러닝의 경우 AGATa는 효과가 있었습니다.