분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
월간 데이콘 음향 데이터 COVID-19 검출 AI 경진대회
학습시 모두 정상으로 분류되는 문제
안녕하세요
저는 mel spectrogram이랑 cnn으로 수행중인데, 학습시 모든 validation set이 정상class로 분류가 되네요.
혹시 이 문제를 어떻게 해결하셨나요?
저는 random oversampling으로 수행했는데, 더 찾아봐야겠네요
---
확률에서 threshold를 찾다니.. 처음 들었네요 감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
종버버버님의 모델 학습 로그 (Loss 로그)를 자세하게 볼 수 없어서 구체적으로 무슨 문제인지는 알 수 없지만,
아마 대부분 학습 데이터가 정상class라 그런것으로 보입니다.
Class imbalanced를 해소하는 기법들을 서치해보시는 것을 추천드립니다.
혹은 간단한 방법으로 대부분 정상class로 이루어진 데이터셋으로 단순하게 학습된 모델은 대부분 0에 가까운 확률(sigmoid 값)을 출력할 것입니다.
이를 바탕으로 Label을 결정하는 Threshold를 Validation set을 통해서 적절하게 조절해보시는 것도 좋을 것 같습니다.