분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 5th, 0.60663] Pycaret(nb,qda,lda)
안녕하세요. 대회에 참여한 kingnamji입니다.
음성 데이터를 다뤄본 적이 없었는데, 좋은 주제를 통해 관련 방법론들을 재밌게 공부한 것 같습니다.
대회 열어주신 DACON과 모든 참여자분들 고생하셨습니다!
(모든 코드는 Colab을 기준으로 작성했습니다.)
1. Pycaret과 2D CNN, Tabnet 등 여러 시도를 했으나 Pycaret이 가장 우수한 성능을 보였습니다.
2. Data Augmentation, Upsampling, Downsampling을 적용해본 결과, 오히려 성능이 저하돼 최종 solution에는 포함하지 않았습니다.
3. 음성 녹음 시간이 각각 달라 전처리 과정에서 데이터의 길이를 고정했습니다.
최종 솔루션을 제외한 다른 시도와 관련된 코드들은 깃허브에 업로드했습니다.
Github : https://github.com/Kingnamji/Covid19_Cough_Classification
감사합니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
좋은 코드공유 감사합니다~