심장 질환 예측 AI 해커톤

알고리즘 | 정형 | 분류 | 질병 | Macro f1 score

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 586명 마감

 

keras deep learning

2021.12.25 21:47 2,772 Views language

label encoding data를 one-hot encoding으로 변경하여 keras의 deep learning 순차모델을 2단계로 쌓아 학습하였습니다.

특이점은 ca column은 0~4 범위의 데이터를가질 수 있지만 train dataset에서 ca값이 4인 data가 없어서 pd.get_dummies()를 통해 on-hot encoding으로 columns생성하여 학습하면 ca=4 인 데이터가 있는 test dataset을 prediction 할 수 없습니다. 따라서 수동으로 ca_4 column을 생성하여 주었습니다.

순차 layer는 3개의 deep learning 층으로 2개 모두 64개의 cell을 가지도록 임의로 지정, activation function은 relu로 하였습니다.
마지막 output layer는 activation function을 sigmoid로 하였습니다.
optimizer는 Nadam, loss는 binary_crossentropy로 하여 batch_size=64, 500회 반복학습시켰습니다.
학습시간은 30초 걸렸으며 model evaluation에서 accuracy는 0.9868로 나왔습니다.

코드 완성이 늦어 제출은 못해봤습니다.

Code