분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Mel-spectrogram로 변환해서 이미지처럼 처리해봤습니다.
음성 파일을 Mel-spectrogram으로 변환한 후 ResNet으로 처리해보았습니다.
대회 성능으론 좋지 않습니다만 음성신호 처리시 고려해볼만한 방법이라 공유하려 합니다.
문제가 있으면 알려주세요
pre-computed power spectrogram 으로 mel-spectrogram을 계산하는데, 그냥 계산하는것과 같은 결과를 도출합니다. 빼셔도 무방해요.
Deleted Comment
홍릉과학출판사, "딥러닝을 위한 푸리에 영상처리"
http://hongpub.co.kr/shop/item.php?it_id=1679017270
추천 드립니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 너무 잘 봤습니다. 멜스펙트럼의 어쿠스틱 피처를 뽑으실때 short 타임 푸리에 트랜스폼을 하신 데이터를 넣으신 이유가 있으실까요?