음성 분류 AI 해커톤

해커톤 | Basic | Audio | Accuracy

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 297명 마감

 

mel-spectrogram, mfcc 활용한 CNN ensemble + 5fold / public 0.98

2022.06.15 14:23 10,340 Views language

tensorflow를 활용한 audio classification

Code
로그인이 필요합니다
0 / 1000
비회원
2022.06.15 14:42

오디오 길이는 왜 통일시켜야할까요??

지우개
2022.06.15 15:38

일반적으로 cnn모델에 넣기위해서는 이미지의 크기를 통일 시켜야합니다.
다른 크기의 이미지 (다른 길이의 오디오)를 학습시켜본 경험이 없어 일반적인 방법을 선택했습니다.
통일 시키기 위해 보통 resize나 crop padding을 실시하는데 데이터의 손실을 최소화하려면 padding의 방법이 적절한 것 같아 padding으로 길이를 통일시켜 학습했고 꽤나 만족스러운 스코어를 얻었습니다.

비회원
2022.06.15 15:48

오디오 길이가 달라도 이미지 크기는 동일하게 만들 수 있지 않나 싶어서 여쭤봤습니다! 제가 잘못 생각한 것 같네요. 감사합니다~ 

천사강쥐
2022.06.15 17:19

코드 공유 감사드립니다. 

지우개
2022.06.16 10:24

감사합니다.

다냐니라
2022.06.15 17:58

음성처리 어떻게 해야할지 감이 안왔는데, 보면서 많이 배웠습니다. 정말 감사드립니다~

지우개
2022.06.16 10:24

감사합니다

shjo
2022.11.22 17:37

삭제된 댓글입니다

하호호
2023.09.07 16:01

 filepath = f"model.res_test_0615_mels_{fold}.hdf5" 이 부분은 model.res_test_0615_mels_.hdf5 파일을 만들기 위해 짠 코드일까요?
그렇게 이해하고 제가 만들어 놓은 폴더에 저걸 만들려고 했는데 디렉토리를 찾을 수 없다고 뜹니다. 
생성이 되는 건데 왜 디렉토리를 찾을 수 없는 오류가 뜨는지 궁금합니다. 
경로는 경로찾기 복사를 한 것이라 틀리지 않습니다.
다른 건 다 되는데 저 부분이 막혀서 질문 드립니다. 

sueun
2023.12.30 12:31

왜 pre trained 모델이 불가능한건가요?