심장 질환 예측 AI 해커톤

알고리즘 | 정형 | 분류 | 질병 | Macro f1 score

  • moneyIcon Prize : 참가시 최소 50 XP, 특별상 데이콘 후드
  • 559명 마감

 

Basic Modeling (public: 0.8985507246)

2021.12.23 01:33 1,234 Views language

데이터수가 train이 150개, test가 150개인 데이터셋이 굉장히 작은 문제라는 점에 주목했습니다.
XGBoost는 최소 3000개정도, LGBM같은 경우 그 이상의 데이터셋이 있을 때 좋은 성능을 보이는 분류기이기에 
가장 Simple한 모델을 사용하는 것이 좋은 성능을 보일 것이라 생각했고 Logistic Regression을 이용해서 제출하였습니다.
제출까지의 과정이 어려우신 분들은 제 코드를 보면서 순서를 익히시면 도움이 많이 되실 것이라고 생각합니다! 조금이라도 도움이 된다면 좋겠네요 ㅎ.ㅎ

Code
로그인이 필요합니다
0 / 1000
ssu통계학과
2021.12.23 23:03

좋은 코드 감사합니다. 특히 마지막 부분 로지스틱 회귀모형이 데이터 숫자가 적을 때 효율적이라는 것이 도움이 많이 됬습니다.

mkk4726
2021.12.27 19:04

감사합니다 ㅎㅎ