대구 교통사고 피해 예측 AI 경진대회 수상자 코드 해설서

정형, 중급, 교통, 회귀

  • 중급 프로젝트
  • 0 시간 4 스테이지
  • 15 명

프로젝트 설명

어떤 프로젝트일지 시작하기 전에 읽어보세요

필수 선행 학습 📖


개요

  • 🚀 대구 교통 사고 데이터 전처리와 분석

  • 경진대회 수상자의 코드를 통해 대구 교통 사고 데이터를 분석 및 전처리하는 과정을 배우고, 이를 모델링에 활용 가능한 형태로 정리합니다. 실습 중심으로 구성되어 있어 데이터를 직접 다루며 필요한 기법을 익힐 수 있습니다.

  • 이 수상자 코드 해설서는 문자열 추출, 파생 변수 생성, 데이터 처리 등 데이터 분석 전반의 기술을 배우는 데 중점을 둡니다. 학습자가 데이터를 변환 및 정리하여 머신러닝 및 예측 모델에 반영할 수 있도록 돕습니다.


학습 내용

  • 🎯스테이지 1 : 대구 교통사고 위험 요인 탐색적 데이터 분석

  • 탐색적 데이터 분석을 통해 데이터셋에 대한 특성을 파악하고 인사이트를 도출합니다.

  • 데이터셋을 살펴 보는 과정에서 탐색적 데이터 분석 방법을 학습합니다.

  • 🎯스테이지 2 : 데이터 전처리 및 피쳐 엔지니어링

  • 인사이트를 반영한 데이터셋 전처리 및 피쳐 엔지니어링을 수행합니다.

  • 파생 변수를 생성하고, 생성한 파생 변수를 데이터셋에 추가하는 방법을 학습합니다.

  • 🎯스테이지 3 : 데이터 전처리 및 피쳐 엔지니어링 심화

  • 외부 데이터를 불러오는 방법을 학습합니다.

  • 외부 데이터를 기본 데이터의 형식에 맞게 가공하는 방법을 학습합니다.

  • 🎯스테이지 4 : 모델 훈련 및 예측

  • XGBoost 와 LightGBM 모델을 훈련하고 앙상블하는 방법을 배웁니다.

  • 학습한 모델을 저장하고 불러오는 방법을 학습힙니다.

프로젝트 과정

차근차근 단계를 밟아 학습해보세요.

스테이지 4 개

1. 대구 교통사고 위험 요인 탐색적 데이터 분석
2. 데이터 전처리 및 피쳐 엔지니어링
3. 데이터 전처리 및 피처 엔지니어링 심화
4. 모델 훈련 및 예측

내 학습 진도

1. 대구 교통사고 위험 요인 탐색적 데이터 분석
paleblue. picture

paleblue.

🥈 제 1회 Medical AI (MAI) 경진대회

더보기