음성 감정 인식 AI 경진대회 월간 데이콘

알고리즘 | 음향 | 감정인식 | 분류 | Accuracy

  • moneyIcon 상금 : 인증서
  • 828명 마감

 

Mel-spectrogram로 변환해서 이미지처럼 처리해봤습니다.

2023.05.22 11:24 1,465 조회 language

음성 파일을 Mel-spectrogram으로 변환한 후 ResNet으로 처리해보았습니다.
대회 성능으론 좋지 않습니다만 음성신호 처리시 고려해볼만한 방법이라 공유하려 합니다.
문제가 있으면 알려주세요

코드
로그인이 필요합니다
0 / 1000
byc3230
2023.05.22 17:53

코드 너무 잘 봤습니다. 멜스펙트럼의 어쿠스틱 피처를 뽑으실때 short 타임 푸리에 트랜스폼을 하신 데이터를 넣으신 이유가 있으실까요?

bluebear7878
2023.05.23 12:22

pre-computed power spectrogram 으로 mel-spectrogram을 계산하는데,  그냥 계산하는것과 같은 결과를 도출합니다. 빼셔도 무방해요.

bluebear7878
2023.05.23 12:22

삭제된 댓글입니다

제갈식
2023.11.02 17:41

홍릉과학출판사, "딥러닝을 위한 푸리에 영상처리"
http://hongpub.co.kr/shop/item.php?it_id=1679017270

추천 드립니다.