데이터 분류 모델 만들기

성능 검증, metric, 평가 지표

주제학습 프로젝트
3 시간 4 스테이지
383 명

프로젝트 설명

어떤 프로젝트일지 시작하기 전에 읽어보세요

개요

본 주제학습 "분류문제 모델 학습 및 성능 검증" 과정은 머신러닝 공부를 이제 막 시작한 입문자를 위한 교제입니다. 전처리, 피처 엔지니어링, 모델 고도화 과정 등 머신러닝 워크 플로우 상에서 거의 모든 단계에 필요한 기본적인 내용을 담고 있어 입문자에게는 필수적인 과정입니다.

이 교재를 통한 학습은 머신러닝 분야에 첫발을 내딛는 이들에게 분류 문제에 대한 모델 구현 및 성능 검증에 대한 이론적인 이해와 함께 실전 대회 데이터를 활용한 실습을 통하여 기본을 탄탄히 다질수 있는 내용만을 담아 내고 있습니다.

학습 목표

스테이지 1: 분류 문제 개요

이 단계에서는 분류 문제의 정의와 다양한 종류를 소개합니다. 머신러닝에서 분류 문제의 중요성을 이해하고, 실제 사례를 통해 어떻게 적용되는지 학습합니다. 또한, 데이터셋을 분석하여 타겟 변수를 예측하기 위한 범주의 종류와 각 범주별 빈도수를 코드 실습을 통해 파악하는 방법을 배웁니다.

스테이지 2: 모델 학습과 예측

이 단계에서는 머신러닝 모델을 학습시키는 과정과 새로운 데이터에 대한 예측 방법을 배웁니다. Scikit-learn 라이브러리를 활용하여 학습 데이터의 feature set을 학습하고, 정답지가 없는 새로운 데이터셋에 대한 예측을 수행하는 과정을 실습합니다. 이 과정을 통해 모델 학습의 기본 원리와 예측의 의미를 깊이 있게 이해할 수 있습니다.

스테이지 3: 분류 문제 성능 평가 지표

분류 모델의 성능을 평가하는 지표들을 학습합니다. Accuracy, Precision, Recall, F1-score와 같은 대표적인 성능 평가 지표의 정확한 개념을 confusion matrix를 통해 이해하며, 이를 실제 문제에 어떻게 적용하는지 배웁니다. 이를 통해 모델의 성능을 정확하게 평가하고 개선 방향을 모색할 수 있는 능력을 기릅니다.

스테이지 4: 모델 성능 검증

마지막 단계에서는 학습 데이터를 학습용과 검증용으로 분할하여, 모델의 성능을 객관적으로 평가하는 방법을 배웁니다. Scikit-learn의 train_test_split 모듈을 활용하여 모델 학습과 성능 검증 과정을 실습합니다. 실전 대회 데이터를 활용한 실습을 통해, 실제 환경에서 모델의 성능을 검증하고 최적화하는 방법을 익힐 수 있습니다.

필수 선행 학습 📖

머신러닝 사전 작업: 데이터 전처리

프로젝트 과정

차근차근 단계를 밟아 학습해보세요.

스테이지 4 개

1. 분류 문제 정의와 종류

2. 모델 학습과 예측

3. 분류 문제 성능 평가 지표

4. 모델 성능 검증

해커톤

고객 대출등급 분류 AI 해커톤

지금 바로 데이터 분석가로서의 첫걸음을 내딛어 보세요.

내 학습 진도

1. 분류 문제 정의와 종류

데이스쿨

안녕하세요! 🙋‍♀️ 데이스쿨은 인공지능 초/중급 학습자를 위한 프로젝트 학습, 해커톤, 트랙으로 구성된 학습 플랫폼이에요. 부단한 연습과 매일의 작은 노력을 통해 여러분의 학습 목표를 달성해 보세요. 🏆 여러분의 성공을 위해 데이스쿨이 함께 할게요. 🎉 📧 문의: dacon0school@gmail.com

연관된 연습 대회 추천

해커톤

고객 대출등급 분류 AI 해커톤

지금 바로 데이터 분석가로서의 첫걸음을 내딛어 보세요.