월간 데이콘 영어 음성 국적 분류 AI 경진대회

알고리즘 | Audio | 분류 | 자연어 | LogLoss

  • moneyIcon 상금 : 100만원
  • 465명 마감

 

Private 20위, Private 점수 :1.13171, Conv1D

2021.07.05 13:57 2,535 조회 language

대회결과를 보면 코드공유할 실력은 안됩니다. 다른 순위권 전문가분께서 사용했을지 모르겠지만 좋은 라이브러리가 있어 소개드릴까 해서 올려봅니다.
Signal 대회의 경우 Keras 사용자라면 보편적으로 사용하면 좋을만한 라이브러리입니다.

● 소개 라이브러리 : KAPRE 0.3.5 (Keras Audio Preprocessors, Signal 파일 분석에 필요한 나름 정교한 라이브러리)
   https://kapre.readthedocs.io/en/latest/
● 위 라이브러리를 사용한 코드를 공유합니다.
     - 실행하실 때 COLAB 환경이면 IS_COLAB 을 True로 변경하셔야 합니다.
     - 각종 디렉토리 경로는 디렉토리 생성 후 잡아주시면 좋겠습니다.
● 뽀나스 !!!
     - 본 대회와 같이 기가 단위 이상의 빅데이타를 다루는 경우 아래 코드에서 작성한 DataGenerator() 함수가 많은 도움이 될 것 같네요.
     - 만약 librosa 는 정규화된 결과가 추출되니, librosa를 사용하는 경우 LayerNormalization를 제거하는게 좋습니당~(저는 scipy써요~)

Ps. 도움 되셨으면 좋아요~쿡~ 부탁해요~

코드
로그인이 필요합니다
0 / 1000
DACON.tuna
2021.07.05 14:18

데이터만 받아 놓고 용량이 커서 어떻게 처리해야 하나 고민하고 있었는데 많은 도움이 될 것 같습니다. 감사합니다!

이대권
2021.07.05 22:41

👩🏻‍💻 공부열심히 하겠습니다. 감사합니다.