데이터 분류 모델 만들기

성능 검증, metric, 평가 지표

  • 주제학습 프로젝트
  • 3 시간 4 스테이지
  • 311 명

프로젝트 설명

어떤 프로젝트일지 시작하기 전에 읽어보세요

개요

본 주제학습 "분류문제 모델 학습 및 성능 검증" 과정은 머신러닝 공부를 이제 막 시작한 입문자를 위한 교제입니다. 전처리, 피처 엔지니어링, 모델 고도화 과정 등 머신러닝 워크 플로우 상에서 거의 모든 단계에 필요한 기본적인 내용을 담고 있어 입문자에게는 필수적인 과정입니다.

이 교재를 통한 학습은 머신러닝 분야에 첫발을 내딛는 이들에게 분류 문제에 대한 모델 구현 및 성능 검증에 대한 이론적인 이해와 함께 실전 대회 데이터를 활용한 실습을 통하여 기본을 탄탄히 다질수 있는 내용만을 담아 내고 있습니다.

학습 목표


스테이지 1: 분류 문제 개요

이 단계에서는 분류 문제의 정의와 다양한 종류를 소개합니다. 머신러닝에서 분류 문제의 중요성을 이해하고, 실제 사례를 통해 어떻게 적용되는지 학습합니다. 또한, 데이터셋을 분석하여 타겟 변수를 예측하기 위한 범주의 종류와 각 범주별 빈도수를 코드 실습을 통해 파악하는 방법을 배웁니다.

스테이지 2: 모델 학습과 예측

이 단계에서는 머신러닝 모델을 학습시키는 과정과 새로운 데이터에 대한 예측 방법을 배웁니다. Scikit-learn 라이브러리를 활용하여 학습 데이터의 feature set을 학습하고, 정답지가 없는 새로운 데이터셋에 대한 예측을 수행하는 과정을 실습합니다. 이 과정을 통해 모델 학습의 기본 원리와 예측의 의미를 깊이 있게 이해할 수 있습니다.

스테이지 3: 분류 문제 성능 평가 지표

분류 모델의 성능을 평가하는 지표들을 학습합니다. Accuracy, Precision, Recall, F1-score와 같은 대표적인 성능 평가 지표의 정확한 개념을 confusion matrix를 통해 이해하며, 이를 실제 문제에 어떻게 적용하는지 배웁니다. 이를 통해 모델의 성능을 정확하게 평가하고 개선 방향을 모색할 수 있는 능력을 기릅니다.

스테이지 4: 모델 성능 검증

마지막 단계에서는 학습 데이터를 학습용과 검증용으로 분할하여, 모델의 성능을 객관적으로 평가하는 방법을 배웁니다. Scikit-learn의 train_test_split 모듈을 활용하여 모델 학습과 성능 검증 과정을 실습합니다. 실전 대회 데이터를 활용한 실습을 통해, 실제 환경에서 모델의 성능을 검증하고 최적화하는 방법을 익힐 수 있습니다.

필수 선행 학습 📖

머신러닝 사전 작업: 데이터 전처리

프로젝트 과정

차근차근 단계를 밟아 학습해보세요.

스테이지 4 개

1. 분류 문제 정의와 종류
2. 모델 학습과 예측
3. 분류 문제 성능 평가 지표
4. 모델 성능 검증
해커톤
고객 대출등급 분류 AI 해커톤
지금 바로 데이터 분석가로서의 첫걸음을 내딛어 보세요.
Related project image

내 학습 진도

1. 분류 문제 정의와 종류
데이스쿨 picture

데이스쿨

안녕하세요! 🙋‍♀️ 데이스쿨은 인공지능 초/중급 학습자를 위한 프로젝트 학습, 해커톤, 트랙으로 구성된 학습 플랫폼이에요. 부단한 연습과 매일의 작은 노력을 통해 여러분의 학습 목표를 달성해 보세요. 🏆 여러분의 성공을 위해 데이스쿨이 함께 할게요. 🎉 📧 문의: dacon0school@gmail.com

더보기

연관된 연습 대회 추천

해커톤
고객 대출등급 분류 AI 해커톤
지금 바로 데이터 분석가로서의 첫걸음을 내딛어 보세요.