음성 감정 인식 AI 경진대회 월간 데이콘

알고리즘 | 음향 | 감정인식 | 분류 | Accuracy

제출

Mel-spectrogram로 변환해서 이미지처럼 처리해봤습니다.

2023.05.22 11:24 4,562 조회 language

음성 파일을 Mel-spectrogram으로 변환한 후 ResNet으로 처리해보았습니다.
대회 성능으론 좋지 않습니다만 음성신호 처리시 고려해볼만한 방법이라 공유하려 합니다.
문제가 있으면 알려주세요

코드

로그인이 필요합니다

comment

0 / 1000

byc3230

2023.05.22 17:53

코드 너무 잘 봤습니다. 멜스펙트럼의 어쿠스틱 피처를 뽑으실때 short 타임 푸리에 트랜스폼을 하신 데이터를 넣으신 이유가 있으실까요?

bluebear7878

2023.05.23 12:22

pre-computed power spectrogram 으로 mel-spectrogram을 계산하는데, 그냥 계산하는것과 같은 결과를 도출합니다. 빼셔도 무방해요.

bluebear7878

2023.05.23 12:22

삭제된 댓글입니다

제갈식

2023.11.02 17:41

홍릉과학출판사, "딥러닝을 위한 푸리에 영상처리"
http://hongpub.co.kr/shop/item.php?it_id=1679017270

추천 드립니다.

현재 글

Mel-spectrogram로 변환해서 이미지처럼 처리해봤습니다.

대회 - 음성 감정 인식 AI 경진대회 월간 데이콘

2년 전