line-coupon

데이스쿨 할인 리턴즈

line-coupon-mobile

데이스쿨 할인 리턴즈

음성 감정 인식 AI 경진대회 월간 데이콘

알고리즘 | 음향 | 감정인식 | 분류 | Accuracy

인증서
975명 마감

대회안내 데이터 코드 공유 토크 리더보드

제출

huggingface를 통한 speech-to-text 피처 생성

파이썬초보만

2023.05.11 00:07 3,808 조회 language

language

audio를 텍스트로 변환하는 코드입니다.

wav2vec2를 통해 텍스트를 추출하고 textblob 라이브러리를 통해 추가적으로 후처리를 진행합니다.

텍스트를 사용해 추가적인 EDA를 하거나, 텍스트와 오디오 모두 사용하는 multimodal 학습으로 접근하는것도 좋을 것 같습니다.

코드

로그인이 필요합니다

comment

0 / 1000

bluebear7878

2023.05.23 15:19

혹시 text 로 분류모델 넣어보셨나요? 저도 해봣는데 성능이 너무 낮게나오는데 제가 코드를 잘 못 짠건지, 대략적인 성능을 알려주실수있나요?

파이썬초보만

2023.05.23 21:53

텍스트로 분류모델 넣었을때 0.2 정도 나왔습니다

Lys

2023.05.24 14:42

변환한 텍스트를 자세히 살펴보면 동일한 텍스트에 다른 라벨이 부여된 경우가 많습니다. 텍스트로서의 의미보다 소리의 강, 약 등의 요소로 인해 라벨이 부여된 것으로 보입니다.

📣 댓글 작성 창의 위치가 댓글 리스트 상단으로 이동했습니다!

to_list

[private 13th] model generalization 개선 방법

대회 - 음성 감정 인식 AI 경진대회 월간 데이콘

현재 글

huggingface를 통한 speech-to-text 피처 생성

대회 - 음성 감정 인식 AI 경진대회 월간 데이콘

좋아요 11

조회 3,808

댓글 3

3년 전

[Baseline] MFCC 기반 Feature 추출 + Decision Tree를 활용한 분류

대회 - 음성 감정 인식 AI 경진대회 월간 데이콘