음성 감정 인식 AI 경진대회 월간 데이콘

알고리즘 | 음향 | 감정인식 | 분류 | Accuracy

  • moneyIcon Prize : 인증서
  • 890명 마감

 

[private 6th] wav2vec2, MFH

2023.06.06 20:07 1,773 Views language

model1: wav2vec2
model2: wav2vec2
model3: MFH (Multi-modal Factorized High-order pooling approach)

train data와 valid data를 다르게 나눠서 model1과 model2를 학습
model1과 model2의 feature 값을 model3으로 학습하여 음성의 감정을 예측

아래 코드는 epoch가 1 인 코드 실제 학습시에는 100으로 학습을 진행 (RTX 8000 * 3 )

Code