Voice Classification AI Hackathon

Hackathon | Audio | Accuracy

참가시 최소 50 XP, 특별상 데이콘 후드
304 Users Completed

Practice

Overview Data Code (share) Talk Leaderboard

Submission

mel-spectrogram, mfcc 활용한 CNN ensemble + 5fold / public 0.98

지우개

2022.06.15 14:23 14,967 Views language

tensorflow를 활용한 audio classification

Code

10 Comments

comment

0 / 1000

비회원

2022.06.15 14:42

오디오 길이는 왜 통일시켜야할까요??

지우개

2022.06.15 15:38

일반적으로 cnn모델에 넣기위해서는 이미지의 크기를 통일 시켜야합니다.
다른 크기의 이미지 (다른 길이의 오디오)를 학습시켜본 경험이 없어 일반적인 방법을 선택했습니다.
통일 시키기 위해 보통 resize나 crop padding을 실시하는데 데이터의 손실을 최소화하려면 padding의 방법이 적절한 것 같아 padding으로 길이를 통일시켜 학습했고 꽤나 만족스러운 스코어를 얻었습니다.

비회원

2022.06.15 15:48

오디오 길이가 달라도 이미지 크기는 동일하게 만들 수 있지 않나 싶어서 여쭤봤습니다! 제가 잘못 생각한 것 같네요. 감사합니다~

천사강쥐

2022.06.15 17:19

코드 공유 감사드립니다.

지우개

2022.06.16 10:24

감사합니다.

다냐니라

2022.06.15 17:58

음성처리 어떻게 해야할지 감이 안왔는데, 보면서 많이 배웠습니다. 정말 감사드립니다~

지우개

2022.06.16 10:24

감사합니다

shjo

2022.11.22 17:37

Deleted Comment

하호호

2023.09.07 16:01

filepath = f"model.res_test_0615_mels_{fold}.hdf5" 이 부분은 model.res_test_0615_mels_.hdf5 파일을 만들기 위해 짠 코드일까요?
그렇게 이해하고 제가 만들어 놓은 폴더에 저걸 만들려고 했는데 디렉토리를 찾을 수 없다고 뜹니다.
생성이 되는 건데 왜 디렉토리를 찾을 수 없는 오류가 뜨는지 궁금합니다.
경로는 경로찾기 복사를 한 것이라 틀리지 않습니다.
다른 건 다 되는데 저 부분이 막혀서 질문 드립니다.

sueun

2023.12.30 12:31

왜 pre trained 모델이 불가능한건가요?

📣 The comment input field has been moved to the top of the comment list!

List

[Baseline] 2. CNN을 통한 기초 음성 분류

Competition - 음성 분류 AI 해커톤

Current