신용카드 사기 거래 탐지 AI 경진대회 월간 데이콘

알고리즘 | 정형 | 분류 | 탐지 | Macro f1 score

  • moneyIcon Prize : 100만 원 + ɑ
  • 2,133명 마감

 

[Pytorch]신용카드_사기_거래_탐지_AI_경진대회[Public_score_0_93052]

2022.07.20 17:27 4,346 Views language

안녕하세요. 해당 코드는 0.93052를 얻을 수 있는 코드입니다.
해당 대회에의 상위권은 대부분 public 리더보드에서 0.93052라는 점수를 얻는데, 이는 아마 특정 사기가 정말 잡기 어려워서 그런 것 같습니다.
데이콘 측에서, val 또는 test 데이터셋을 훈련 가능하게 허용하는 것과 같이 제한 조건을 풀어줌으로써 대회에서 더 다양한 아이디어가 나왔으면 좋겠습니다.

Code
로그인이 필요합니다
0 / 1000
뗑컨
2022.07.20 21:57

코드 잘 보고 갑니다~! 그런데 혹시 test셋에 라벨 예측하실 때 k를 318로 잡으신 이유가 있을까요? 

Akynella
2022.07.20 22:03

EllipticEnvelope의 predict 기능을 사용하여 제출할 경우 318개 보다 적은 개수를 사기로 잡아내는데 이 경우 퍼블릭 리더보드상의 점수가 낮더군요. 그래서 개수를 늘리다보니 315~318개에서 퍼블릭 리더보드 상 높은 점수를 얻었습니다 

초록
2022.07.21 01:17

EllipticEnvelope 모델을 쓰게 된 이유는 무엇입니까 ?

Akynella
2022.07.21 19:58

isolationforest를 사용할 수 있는 sklearn library에 있는 다양한 모델들을 시도하던 중 EllipticEnvelope의 성능이 가장 좋아서 사용하게 되었습니다!

이펭귄
2022.07.21 15:27

support_fraction을 0.994로 설정한 이유가 있을까요?

Akynella
2022.07.21 19:59

EllipticEnvelope의 파라미터를 조정하면서 성능을 체크해보았는데 support_fraction이 0.994일때가 성능이 가장 좋아서 사용했습니다!

이펭귄
2022.07.22 10:03

감사합니다

땅땅이
2022.07.21 21:24

오 저랑 같은모델을 사용하셨네요! 맞아요 저도 이것저것 해보다가 성능이 좋아서 사용했어요

Data is money
2022.07.29 12:51

오 가우시안분포를 사용하는거군요 공유 감사합니당! 

zzugest
2022.08.02 12:58

EllipticEnvelope함수가 
train데이터에 종속변수(Class)가 없는 경우에 사용되는 기법인가요?