line-coupon

DASCHOOL 할인 리턴즈

line-coupon-mobile

DASCHOOL 할인 리턴즈

Dacon Monthly Speech Emotion Recognition AI Challenge

Algorithm | Audio | Emotion Recognition | Classification | Accuracy

Certification
975 Users Completed

Overview Data Code (share) Talk Leaderboard

Submission

huggingface를 통한 speech-to-text 피처 생성

파이썬초보만

2023.05.11 00:07 3,809 Views language

language

audio를 텍스트로 변환하는 코드입니다.

wav2vec2를 통해 텍스트를 추출하고 textblob 라이브러리를 통해 추가적으로 후처리를 진행합니다.

텍스트를 사용해 추가적인 EDA를 하거나, 텍스트와 오디오 모두 사용하는 multimodal 학습으로 접근하는것도 좋을 것 같습니다.

Code

Login Required

comment

0 / 1000

bluebear7878

2023.05.23 15:19

혹시 text 로 분류모델 넣어보셨나요? 저도 해봣는데 성능이 너무 낮게나오는데 제가 코드를 잘 못 짠건지, 대략적인 성능을 알려주실수있나요?

파이썬초보만

2023.05.23 21:53

텍스트로 분류모델 넣었을때 0.2 정도 나왔습니다

Lys

2023.05.24 14:42

변환한 텍스트를 자세히 살펴보면 동일한 텍스트에 다른 라벨이 부여된 경우가 많습니다. 텍스트로서의 의미보다 소리의 강, 약 등의 요소로 인해 라벨이 부여된 것으로 보입니다.

📣 The comment input field has been moved to the top of the comment list!

to_list

[private 13th] model generalization 개선 방법

Competition - 음성 감정 인식 AI 경진대회 월간 데이콘

Current

huggingface를 통한 speech-to-text 피처 생성

Competition - 음성 감정 인식 AI 경진대회 월간 데이콘

Likes 11

Views 3,809

Comments 3

3년 전

[Baseline] MFCC 기반 Feature 추출 + Decision Tree를 활용한 분류

Competition - 음성 감정 인식 AI 경진대회 월간 데이콘