신용카드 사기 거래 탐지 AI 경진대회 월간 데이콘

알고리즘 | 정형 | 분류 | 탐지 | Macro f1 score

  • moneyIcon 상금 : 100만 원 + ɑ
  • 2,013명 마감

 

Private 8위, EllipticEnvelope모델, ISF이용 데이터 전처리 활용

2022.08.07 21:14 1,307 조회 language

크게 아래와 같은 3 단계를 거쳐 모델을 생성하였습니다.

step1) ISF를 이용한 Training Set 비정상 데이터 제거
step2) StandardScaler를 이용한 Normalization
step3) EllipticEnvelope 모델 생성 및 예측

- 모든 피쳐는 사용되었으며 추가적으로 만들어낸 피쳐는 없습니다.
- V30이 일정한 주기를 가진 형태로 분포해 있어서 반으로 접은 후?(0보다 작은 데이터에 모두 1을 더하는 방식) 
  사용해 보았는데 성능의 향상을 가져오는 것 같지는 않았습니다.
 - correlation을 바탕으로 피쳐들 끼리 더하거나 하는 방식으로 새로운 피쳐를 생성해  보기도 하였지만 성능향상이 있지는 않았습니다.

코드