서두르세요! "데이스쿨 40% 할인" 12월 2일까지!
분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
Mel-spectrogram로 변환해서 이미지처럼 처리해봤습니다.
음성 파일을 Mel-spectrogram으로 변환한 후 ResNet으로 처리해보았습니다.
대회 성능으론 좋지 않습니다만 음성신호 처리시 고려해볼만한 방법이라 공유하려 합니다.
문제가 있으면 알려주세요
pre-computed power spectrogram 으로 mel-spectrogram을 계산하는데, 그냥 계산하는것과 같은 결과를 도출합니다. 빼셔도 무방해요.
삭제된 댓글입니다
홍릉과학출판사, "딥러닝을 위한 푸리에 영상처리"
http://hongpub.co.kr/shop/item.php?it_id=1679017270
추천 드립니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
코드 너무 잘 봤습니다. 멜스펙트럼의 어쿠스틱 피처를 뽑으실때 short 타임 푸리에 트랜스폼을 하신 데이터를 넣으신 이유가 있으실까요?