음성 중첩 데이터 분류 AI 경진대회

월간 데이콘 6 | 소리 | 인공지능 AI 활용 목소리 분류 알고리즘 | KL Divergence | Monthly Dacon

  • moneyIcon Prize : 100만원
  • 525명 마감

 

Public LB 1.1522 1D CNN

2020.07.02 00:02 4,083 Views language

베이스라인 코드를 약간 개조한 코드입니다.
기존 Speech command dataset에서도 괜찮은 퍼포먼스를 냈고 Music category multi label 예측에서도 좋은 순위를 냈던 SampleCNN을 사용하였습니다.
또한 다들 아시겠지만 기존 베이스라인에서는 Sample Rate를 1/8로 줄이고 했기 때문에 성능이 많이 떨어지는 경향이 있어서 수정하였습니다.
원본 소스코드와 논문은 https://github.com/tae-jun/sample-cnn에서 확인하실 수 있습니다.
기존에 제가 올린 파일 다운받는 소스와 합치시면 더 편하게 돌려보실 수 있습니다 ㅎㅎ

Code
JGAhn
2020.07.03 15:47

감사합니다 :) 베이스 모델에서 sample rate를 1/8로 줄인것 아니었나요..? 1/4인가요..

bbchip13
2020.07.03 19:35

맞습니다. 제가 햇갈렸네요 ㅠㅠ 수정했습니다!

로그인이 필요합니다
0 / 1000