당뇨병 위험 분류 예측 프로젝트 🤢

중급, 정형, 분류, 의료

  • 중급 프로젝트
  • 10 시간 8 스테이지
  • 1046 명

프로젝트 설명

어떤 프로젝트일지 시작하기 전에 읽어보세요

프로젝트 개요

프로젝트의 초점은 단순한 머신러닝 기법의 학습을 넘어 데이터 분석, 전처리, 피처 엔지니어링, 모델링 기법에 집중하며, 창의적인 분석 역량의 향상을 목표로 합니다.

학습 목표

본 프로젝트의 목표는 실제 데이터 사이언티스트들이 문제에 직면했을 때 적용하는 방법론을 예시하며, 실질적인 데이터 분석 및 모델링 기법을 깊이 있게 배우는 것입니다. 데이커와 데이터 사이언티스트를 대상으로 하며, 머신러닝 대회에서 상위 랭커로 도약할 수 있는 실용적인 기술과 방법론을 전수합니다. 이러한 교육은 참가자들의 전문성을 향상시키고, 취업 시장에서의 경쟁력을 높일 수 있습니다.

프로젝트 설명

이 프로젝트는 당뇨병 발병 여부를 예측하는 문제로, 머신러닝 입문자와 중급자를 대상으로 합니다. 데이터와 타겟 변수와의 관계를 깊이있게 분석하고 최적의 모델을 찾아 고도의 성능을 내는 방식을 배울 수 있는 교재입니다.

산업 적용

의료 분야의 대표적인 정형데이터를 이용해 데이터분석을 진행해, 의료 분야에서의 데이터분석이 어떠한 특징이 있는지 공부해 보세요.

프로젝트 과정

차근차근 단계를 밟아 학습해보세요.

스테이지 8 개

1. 이진 분류 문제 초기 데이터 탐색
2. 탐색적 데이터 분석을 통해 데이터 이해하기
3. 피처 상호 작용과 중요도 분석
4. 이상치 처리와 피처 엔지니어링을 통한 모델 성능 개선
5. 결측치 데이터 분석 통한 향후 모델링 전략 수립 근거 수립
6. 비결측치 그룹에 대한 데이터 전처리 및 피처 엔지니어링
7. 결측치 그룹에 대한 데이터 전처리 및 피처 엔지니어링
8. 데이터 그룹별 모델 최적화 및 결합하기

내 학습 진도

1. 이진 분류 문제 초기 데이터 탐색
데이스쿨 picture

데이스쿨

안녕하세요! 🙋‍♀️ 데이스쿨은 인공지능 초/중급 학습자를 위한 프로젝트 학습, 해커톤, 트랙으로 구성된 학습 플랫폼이에요. 부단한 연습과 매일의 작은 노력을 통해 여러분의 학습 목표를 달성해 보세요. 🏆 여러분의 성공을 위해 데이스쿨이 함께 할게요. 🎉 📧 문의: dacon0school@gmail.com

더보기