갑상선암 진단 분류 해커톤 : 양성과 악성, AI로 정확히 구분하라!

데이콘 해커톤 | 알고리즘 | 입문 | 정형 | 분류 | F1 Score

  • moneyIcon 상금 : 데이스쿨 프로 구독권
  • 2025.05.07 ~ 2025.06.30 09:59 + Google Calendar
  • 990명 마감

 

Private 7위 / 딥러닝 기반 다층 퍼셉트론 모델 / 기본적인 인코딩 및 정규화 기법 사용

2025.07.02 21:08 381 조회 language

1. 개발 환경 : OS=window / tensorflow==2.12.0 / scikit-learn==1.6.1 / imbalanced-learn==0.12.4 / pandas==1.3.4 / numpy==1.22.4
2. 전처리 : Label 세 개 이상의 범주형 데이터에 대한 OrdinalEncoder 적용 및 Label 두 개의 범주형 데이터에 대한 OneHotEncoder 적용, 전체 데이터 대한 RobustScaler와 MinMaxScaler의 순차적 적용
3. 학습
- 모델구성 : Dense layer 기반의 Deep learning 모델 구성 및 output layer와 바로 상위 레이어의 Acivation 일치화 및 Fully-conection 후 Dropout 및 BatchNormalization으로 과적합 방지 및 안정화
- 훈련 설정 : validation_F1_score의 갱신이 500회 이상 되지 않으면 EarlyStopping을 적용하고, F1 기준으로 가장 좋은 모델 가중치 저장

코드