분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Private 4위, Baseline + Pycaret(nb + lr ensemble)]
안녕하세요. Public 18위, Private 4위를 한 alchmach입니다.
음성 데이터를 처음 다뤄봐서 음성 데이터에 대해 여러가지 공부할 수 있었던 좋은 경험이었습니다.
Jupyter notebook 환경에서 작업하였습니다.
저는 Baseline의 Librosa 패키지를 통한 MFCC 기반 Feature 추출을 통한 결과를 가지고, Pycaret 라이브러리를 활용하였습니다.
(Baseline: https://dacon.io/competitions/official/235910/codeshare/5070?page=1&dtype=recent)
Pycaret 라이브러리를 통해 auc 기준 성능이 높은 두 개 모델(Naive Bayes, Logistic Regression )을 가지고 Soft voting 하였습니다.
MFCC기반 Feature 추출을 할 때는 SR과 N_MFCC 값을 Librosa패키지의 기본값(20, 22050)으로 두고 진행했습니다.
제가 아직 부족한 점이 많아서 혹시 문제가 될만한 사항이나 질문 사항 있으시면 댓글 남겨주시면 감사하겠습니다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved