신용카드 사기 거래 탐지 AI 경진대회 월간 데이콘

알고리즘 | 정형 | 분류 | 탐지 | Macro f1 score

  • moneyIcon 상금 : 100만 원 + ɑ
  • 2,048명 마감

 

Private 11위, EllipticEnvelope모델, Feature Engineering 활용

2022.08.07 16:07 1,970 조회 language

DACON 대회를 통하여 많은 지식과 경험을 쌓고 있습니다^^
DACON Baseline과 다른 참가자 분들이 공유해주신 코드를 바탕으로 작업을 진행하였습니다.

ML 기반으로 작업 시에는 변수를 추가하여 모델이 정상과 비정상을 조금 더 뚜렷하게 분류할 수 있도록 하였습니다.

DL 기반으로 작업 시에는 두 가지 방향으로 접근하였습니다.
1. Autoencoder 모델 구조 변경: depth 향상, overcomplete 구조와 undercomplete 구조 비교,  VAE 및 CNN-Autoencoder 등의 모델 적용
2. ML 모델 학습 후 ML 모델의 판별 기준을 바탕으로 정상 데이터만을 선택하여 Autoencoder에 입력(비정상 데이터 최소화 및 정상 데이터에 대한 특성 파악력 향상 목적)

++이외에도 상관 관계 분석 후 변수 간 그룹화를 통하여 앙상블 시도 등이 있었습니다.

코드
로그인이 필요합니다
0 / 1000
KWJ
2023.08.25 10:27

안녕하세요. 좋은 코드 공유 감사합니다. 
혹시 trainer = Trainer(model, optimizer, train_loader, val_loader, scheduler, device)까지는 잘 작동하고 모델도 할당되는데
trainer.fit()에서 아무 응답 없이 계속 돌아가기만 하는 이유를 알 수 있을까요? input size를 잘못 넣었는데도 오류 같은 output이 일절 없이 계속 돌아가기만 합니다. 
gpu도 올바르게 할당해서  torch.cuda.is_available()도 True로 나오는데 이유를 모르겠어서 여쭈어봅니다.

참고로 해당 데이터셋이 아닌 다른 데이터셋에 적용 중이고 중간에 df['class'] 부분도 제 데이터셋에 맞게 수정했습니다.