심장 질환 예측 AI 해커톤

알고리즘 | 정형 | 분류 | 질병 | Macro f1 score

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 589명 마감

 

10가지 간단한 ML 기반 Classifier를 이용한 Training 및 Predict

2021.12.13 15:59 5,105 Views language

안녕하세요,

이번 코드 공유는 정말로! 연습을 위해서 참여하신 분들께 도움을 드리고자 작성했습니다.
제공받은 데이터를 받자마자 막막하셨던 분들이 꼭 계실거라고 생각합니다!
EDA니, 전처리니 ... 처음에는 모든게 생소한 여러분들이라면 우선 가지고 있는 데이터를 다양한 model들을 이용해서 학습하고 예측해보고 싶으실 겁니다.
우선 눈앞에 보이는 결과가 있어야 행복해지고 동기부여도 되니까요! (저도 또한 그렇습니다.)

그래서, Machine learning 기반의 약 10개의 classifier들을 이용하여 데이터를 학습하고 예측한 후 정답지 형식으로 저장하는 코드를 공유드리고자 합니다.
여러분께서는 코드 내의 datapath에 여러분께서 받으신 데이터가 위치한 경로만 입력해주시면 됩니다!

해당 결과로 바로 제출까지 해 볼 수 있는데요, 저는 svm, tree, adaboost 모델을 우선 제출해보았고 (하루 3회 제한 ㅠ ), svm모델의 결과가 작성시점 기준 7위로 랭크 되었습니다. 

추후에는 feature들을 더 자세히 살펴보고 튜닝하는 과정을 거쳐보도록 하겠습니다.
많은 도움 되시길 바라며, 궁금한 점이 있으시면 댓글 남겨주시면 확인하고 답변 드리겠습니다 ! (댓글이 달리는지는 모르겠지만 가능하면 확인하겠습니다)

마지막으로 !!! 저는 후드가 !!!! 아주 매우 많이 !! 가지고 싶습니다 !!! 꼭 좋아요 눌러주세요 ㅠㅠㅠ
그럼, 즐거운 코딩 되세요 : )

Code
로그인이 필요합니다
0 / 1000
kth9934
2021.12.13 16:06

참고로, tqdm 라이브러리는 for문의 진행 상황을 tracking 할 때 유용한 라이브러리입니다. (for문을 돌때마다 progress bar가 채워집니다.)
괜히 복잡하게 넣은 것 같아 tqdm을 사용하지 않은 형태의 for loop도 댓글로 달아 놓겠습니다. 

tqdm 라이브러리를 사용하지 않으시려면,
empty_list = [] 
empty_list.append(model) 
이 두 줄은 삭제 혹은 주석처리 하시면 되고,

for model in tqdm(model_list, desc = 'Models are training and predicting ... '): 대신
for model in model_list:  를 사용하시면 되겠습니다 : )

CHATILDA
2021.12.24 12:51

말씀하신 것처럼 "연습"을 위해서 참여한 참여자입니다.
for문과 models 함수를 사용하여 간편하게 모델을 선택하신 센스를 배울 수 있었습니다!
또, tqdm 라이브러리는 뭘까? 의문이 들었었는데 먼저 댓글로 남겨주시고 사용하지 않을 경우의 코드 공유까지 해주셔서 도움이 많이 되었습니다.
"연습"을 위한 참여자의 눈높이에 맞춘 설명을 잘해주신 듯 합니다. 꼭 후드 받으시길 응원하겠습니다 :)

Hyejino
2021.12.14 10:34

for문 활용까지 알려주셔서 감사해요! 더 이해가 잘되네요 :D

kth9934
2021.12.14 10:59

댓글 달아주셔서 감사합니다! 도움이 되셨다니 기쁘네요 ㅎㅎ 좋은 하루 되세요 : )

datu
2021.12.14 11:02

좋은 코드 공유 감사합니다. 후드티 꼭 받으시길 바랄께요!

kth9934
2021.12.14 11:13

댓글 감사합니다! 좋은하루 되세요 ~!

뇌파초음파
2021.12.14 13:21

팬이에요

kth9934
2021.12.15 09:04

감사합니다!

필멸자
2021.12.14 14:36

글설리

kth9934
2021.12.15 09:04

정답

이찬
2021.12.17 15:26

팬이에요

kth9934
2021.12.20 10:37

감사합니다 ㅋㅋ!