분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[private 0.96413,5th]Wavelet Decomposition, Isolation Forest
공동작성자
안녕하세요. 이번 월간 데이콘 기계 고장 진단 AI 경진대회에 참가한 SDML입니다.
다양한 경험을 할 수 있도록 좋은 주제를 제공해주신 데이콘 관계자분들께 감사드립니다.
기계공학 분야에서 진동 데이터를 기반으로 스펙토그램 이미지 만들어 이상치 탐지나 분류 알고리즘 구축하는 사례들을 많이 봐왔고 경험했던 적이 있는데, 스팩토그램 이미지 기반 알고리즘 구축의 효율성을 시험해보고자 이번 대회에 참가하게 되었습니다.
실험해본 결과, 단순 이미지 기반 딥러닝 기법보다 특징 추출하여 머신러닝 기법(Isolation Forest)이 더 성능이 우수하네요. (이상탐지)
[간단한 개요]
크게 베이스 라인과 다를 것 없이 MFCC와 Isolation Forest를 사용했고 추가적으로 MFCC와 비슷하게 주파수 대역별로 분해하는 Wavelet Decomposition(WD)을 활용했습니다. 원본 데이터의 Time Domain과 Frequency Domain(WD) 대역별로 10개의 특징을 추출하였고, MFCC는 평균만 사용했습니다. 추출된 특징에 대해 정규화 진행 후 PCA를 적용하였고 Isolation Forest를 학습 시켰습니다.
[제출 결과]
*최종 결과 제출물 - Public Score: 0.97786, Private Score: 0.96413
*현재 코드 결과 제출물 - Public Score: 0.98005, Private Score: 0.97074
두 결과의 차이는 PCA 적용 시 주성분 개수의 차이입니다.
+ 추가로 해본 것들
- Kernel PCA, IQR 범위 이외의 관측치 제거 후 모델 구축, 정규 분포에 벗어난 특징 제거 후 모델 구축
- Convolutional AutoEncoder, F-AnoGAN
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved