월간 데이콘 영어 음성 국적 분류 AI 경진대회

알고리즘 | Audio | 분류 | 자연어 | LogLoss

  • moneyIcon Prize : 100만원
  • 465명 마감

Description

6개국에서 녹음된 mp3 파일을 wav 파일로 변환하여 적재

(모든 음성은 5초 이상의 길이를 갖고 있습니다.)


1. train folder (14.5 GB)

  • Africa folder (2500개의 wav 파일)
  • Australia folder (1000개의 wav 파일)
  • Canada folder (1000개의 wav 파일)
  • England folder (10000개의 wav 파일)
  • Hongkong folder (1020개의 wav 파일)
  • US folder (10000개의 wav 파일)


2. test folder (3.5 GB)

  • 임의로 추출된 6100개 wav 파일


3. sample_submission.csv

  • id : 1~6100까지 test 파일의 id
  • 국가별 음성의 accent 예측 확률을 기재


4. train.csv

  • train data 명세



데이터 출처 : https://commonvoice.mozilla.org/

라이센스 : CC-0

More Data