월간 데이콘 기계 고장 진단 AI 경진대회

알고리즘 | 음향 | 비지도학습 | 이상치 탐지 | Macro F1 Score

  • moneyIcon 상금 : 인증서
  • 876명 마감

 

[private 0.96413,5th]Wavelet Decomposition, Isolation Forest

공동작성자

stroke
2023.01.17 16:53 2,284 조회 language

안녕하세요. 이번 월간 데이콘 기계 고장 진단 AI 경진대회에 참가한 SDML입니다.
다양한 경험을 할 수 있도록 좋은 주제를 제공해주신 데이콘 관계자분들께 감사드립니다.

기계공학 분야에서 진동 데이터를 기반으로 스펙토그램 이미지 만들어 이상치 탐지나 분류 알고리즘 구축하는 사례들을 많이 봐왔고 경험했던 적이 있는데, 스팩토그램 이미지 기반 알고리즘 구축의 효율성을 시험해보고자 이번 대회에 참가하게 되었습니다. 

실험해본 결과, 단순 이미지 기반 딥러닝 기법보다 특징 추출하여 머신러닝 기법(Isolation Forest)이 더 성능이 우수하네요. (이상탐지)

[간단한 개요]
크게 베이스 라인과 다를 것 없이 MFCC와 Isolation Forest를 사용했고 추가적으로 MFCC와 비슷하게 주파수 대역별로 분해하는 Wavelet Decomposition(WD)을 활용했습니다. 원본 데이터의 Time Domain과 Frequency Domain(WD) 대역별로 10개의 특징을 추출하였고, MFCC는 평균만 사용했습니다. 추출된 특징에 대해 정규화 진행 후 PCA를 적용하였고  Isolation Forest를 학습 시켰습니다.

[제출 결과]
*최종 결과 제출물 - Public Score: 0.97786, Private Score: 0.96413
*현재 코드 결과 제출물 - Public Score: 0.98005, Private Score: 0.97074
두 결과의 차이는 PCA 적용 시 주성분 개수의 차이입니다.

+ 추가로 해본 것들
- Kernel PCA, IQR 범위 이외의 관측치 제거 후 모델 구축, 정규 분포에 벗어난 특징 제거 후 모델 구축
- Convolutional AutoEncoder, F-AnoGAN

코드