머신러닝 사전 작업: 데이터 전처리

데이터 전처리, 전처리

  • 주제학습 프로젝트
  • 3 시간 8 스테이지
  • 47 명

프로젝트 설명

어떤 프로젝트일지 시작하기 전에 읽어보세요

무엇을 다루는 교재인가요?

머신러닝 프로젝트의 성공은 좋은 데이터에서 시작됩니다. 아무리 뛰어난 알고리즘을 사용해도, 데이터의 품질이 낮으면 모델의 성능도 떨어질 수밖에 없어요.

본 교재는 머신러닝을 처음 접하는 입문자를 위해 설계된 실습 중심 커리큘럼입니다. 머신러닝의 기본 개념부터 시작해서, 실제 프로젝트에서 가장 중요한 데이터 전처리와 정규 표현식 활용까지 단계적으로 다룹니다. 단순히 이론만 배우는 것이 아니라, 실제 대회 데이터를 활용한 실습을 통해 결측치 처리, 중복 데이터 제거, 텍스트 정제 등 실무에서 자주 마주치는 문제들을 직접 해결해 보면서 데이터 처리 역량과 기본 이론을 자연스럽게 쌓을 수 있도록 구성했어요.


이번 교재에서 배워요.

스테이지 1~2

머신러닝 입문

• 머신러닝의 기본 개념과 인공지능과의 차이점을 이해합니다.
• 지도학습, 비지도학습, 강화학습의 특징과 실제 적용 사례를 학습합니다.
• 머신러닝 프로젝트에서 데이터가 차지하는 핵심적인 역할을 인식합니다.

스테이지 3~5

데이터 전처리 입문

• 데이터 전처리의 중요성과 전체 머신러닝 파이프라인에서의 위치를 파악합니다.
• 결측치를 탐지하고 적절한 방법으로 처리하는 실무 기술을 습득합니다.
• 중복 데이터를 식별하고 제거하는 방법을 실습합니다.

스테이지 6~8

정규 표현식 입문

• 정규 표현식의 기본 문법과 메타문자를 학습합니다.
• 텍스트 데이터 정제에 필수적인 특수 시퀀스와 패턴 매칭 기법을 이해합니다.
• 불규칙한 텍스트 형식을 정규 표현식으로 처리하는 실전 기술을 연습합니다.

학습이 끝나면 이런 것들을 할 수 있어요.

머신러닝 프로젝트의 기초가 되는 데이터 전처리를 독립적으로 수행할 수 있어요

결측치와 중복 데이터 문제를 효과적으로 해결할 수 있어요

정규 표현식으로 복잡한 텍스트 데이터를 정제할 수 있어요

이런 분들에게 추천해요.

머신러닝을 배우기 전에 데이터 처리의 기초를 탄탄히 다지고 싶으신 분

결측치, 중복, 텍스트 정제 같은 실무 문제를 실제로 풀어보고 싶으신 분

정규 표현식은 들어봤지만 실제로 어디에 써먹어야 할지 모르셨던 분

머신러닝을 시작하려는데 데이터 전처리가 막연하신 분

프로젝트 과정

차근차근 단계를 밟아 학습해보세요.

스테이지 8 개

1. 머신러닝 입문
2. QUIZ - 머신러닝 입문
3. 데이터 전처리 입문
4. QUIZ - 데이터 전처리 입문
5. QUIZ - 데이터 전처리 코드 실습
6. 정규 표현식 입문
7. QUIZ - 정규 표현식 입문
8. QUIZ - 정규 표현식 코드 실습

내 학습 진도

1. 머신러닝 입문
데이스쿨 picture

데이스쿨

안녕하세요! 🙋‍♀️ 데이스쿨은 인공지능 초/중급 학습자를 위한 프로젝트 학습, 해커톤, 트랙으로 구성된 학습 플랫폼이에요. 부단한 연습과 매일의 작은 노력을 통해 여러분의 학습 목표를 달성해 보세요. 🏆 여러분의 성공을 위해 데이스쿨이 함께 할게요. 🎉 📧 문의: dacon0school@gmail.com

더보기