월간 데이콘 음향 데이터 COVID-19 검출 AI 경진대회

알고리즘 | Audio | 분류 | 검출 | Macro f1 score

  • moneyIcon 상금 : 100만원 + ɑ
  • 698명 마감

 

[Private 5th, 0.60663] Pycaret(nb,qda,lda)

2022.07.10 22:37 1,528 조회 language

안녕하세요. 대회에 참여한 kingnamji입니다.

음성 데이터를 다뤄본 적이 없었는데, 좋은 주제를 통해 관련 방법론들을 재밌게 공부한 것 같습니다.
대회 열어주신 DACON과 모든 참여자분들 고생하셨습니다! 

(모든 코드는 Colab을 기준으로 작성했습니다.)
1. Pycaret과 2D CNN, Tabnet 등 여러 시도를 했으나 Pycaret이 가장 우수한 성능을 보였습니다. 
2. Data Augmentation, Upsampling, Downsampling을 적용해본 결과, 오히려 성능이 저하돼 최종 solution에는 포함하지 않았습니다. 
3. 음성 녹음 시간이 각각 달라 전처리 과정에서 데이터의 길이를 고정했습니다.

최종 솔루션을 제외한 다른 시도와 관련된 코드들은 깃허브에 업로드했습니다.
Github : https://github.com/Kingnamji/Covid19_Cough_Classification

감사합니다.

코드
로그인이 필요합니다
0 / 1000
리동딱
2022.07.11 13:28

좋은 코드공유 감사합니다~

kingnamji
2022.07.11 16:54

저도 감사드립니다~~