분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[PRIVATE : 0.93957 /18등] MFCC (+ 기타) + Scaler + 차원축소 + LOF
* PUBLIC SCORE (0.98224)에서는 우수한 성능을 보였지만 아쉽게도 PRVIATE SCORE (0.93957)는 좋지 못했습니다
* 이에 대한 원인에 관한 개인적인 생각과 개선 방안 (코드 링크) 이 포함되었있습니다 (이상치 조절 및 학습 데이터 양 감소에 따른 문제 발생)
* 이번 대회를 통해 많은 것을 공부할 수 있었습니다 감사합니다
* 이외에 여러 생각과 정리 자료는 다음의 주소에서 확인할 수 있습니다. (https://github.com/namwootree/Breakdown-in-Machine)
* 중요한 건 꺽이지 않는 PRVIATE SCORE
* PUBLIC SCORE에 속아 일반화를 잊지 말자
Process
1. Feature Extraction
- Zero Crossing Rate (+ delta)
- RMS (+ delta)
- Poly Feature
- MFCC
- Spectral Flatness
2. Robust Scaling
3. Dimension Reduction
- Sparse PCA : Zero Crossing Rate (+ delta), RMS (+ delta), MFCC, Spectral Flatness
- Kernel PCA : Poly Feature
4. LOF
5. 개인적인 생각 + 개선된 알고리즘
감사합니다. 저의 기억으로는 찌니찌니 팀은 딥러닝 모델을 활용한 것으로 알고 있습니다. 역량이 부족하여 딥러닝으로 수행하지 못하였습니다. 어떻게 수행하셨는지 알 수 있을까요?
저희팀 딥러닝 모델을 사용한 것을 어떻게 아시나요??
글 작성 예정이지만,
MFCC의 각 주파수 Feature를 하나의 unit으로 잡고 VAE를 사용하여 학습하고 결과 도출했습니다.
안녕하세요 허준호님 예전에 토크 게시판에 팀을 구하며 pytorch로 구현하고자 한다는 글을 본 적이 있습니다. 그리고 알려주셔서 감사합니다.
불편하셨다면 사과의 말씀드리겠습니다 죄송합니다
아닙니다! 궁금해서요 ㅎㅎㅎ
기억력 좋으시네요
추후 작성할 코드리뷰에 좀 더 상세하게 적을 예정입니다.
친절한 코드 설명 감사합니다
딥러닝을 활용한 Anomaly Detection에 관심이 많습니다. 감사합니다.
찌니찌니님 팀은.. MFCC 각 주파수 기반 VAE 사용하셨군요..
MFCC/Chroma_stft 평균을 사용하여 VAE, LSTM VAE, AE, LSTM AE, +attention 등까지 사용해봤는데.. public 96을 넘지 못했었는데.. 좀 더 디테일한 주파수에 답이 있었군요^^;; 하나 또 배워갑니다.
피처 추출 과정에서 산술평균 대신 절사평균을 사용하는 것 또한 일반화에 도움이 된다고 생각합니다 (단, PUBLIC SCORE는 낮아지는 것으로 기억합니다)
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
공유 감사합니다. !!! EDA도움 많이 됬습니다