시계열 데이터 사전 처리하기

전처리, 시계열 , time series

  • 주제학습 프로젝트
  • 0 시간 4 스테이지
  • 261 명

프로젝트 설명

어떤 프로젝트일지 시작하기 전에 읽어보세요

필수 선행 학습 📖

머신러닝 사전 작업: 데이터 전처리
성능 향상을 위한 변수 조합 만들기


학습 목표


스테이지 1: 시계열 데이터와 예측 개요

이 스테이지에서는 시계열 데이터의 기본 특성을 이해하고, 시간 패턴의 중요성을 인식합니다. Python의 datetime 모듈을 활용하여 날짜와 시간 데이터를 처리하는 방법을 학습하고, 이를 기반으로 미래 날짜를 계산하고, 시간 차이를 측정하여 시계열 데이터 분석의 기초를 다집니다.

스테이지 2: pandas를 활용한 날짜 및 시간 데이터 처리

이 스테이지에서는 pandas의 강력한 날짜 및 시간 처리 기능을 익힙니다. Timestamp 객체를 생성하고, 문자열에서 날짜/시간 데이터를 변환하는 방법을 배웁니다. 또한, 시간대 설정 및 변환, 리샘플링, 특정 시간대의 데이터 필터링 등을 통해 시계열 데이터를 효과적으로 다루는 방법을 학습합니다.

스테이지 3: 시계열 데이터 분석 및 전처리

이 스테이지에서는 시계열 데이터의 결측치를 탐색하고, 선형 보간법 및 전후 값 채우기 등 다양한 결측치 처리 방법을 적용하여 데이터의 연속성을 유지합니다. 또한, 시계열 데이터를 리샘플링하여 변동성을 평활화하고, 업샘플링을 통해 세밀한 분석을 수행하는 방법을 학습합니다.

스테이지 4: 시계열 데이터 분석과 파생 변수 생성

이 스테이지에서는 시간대와 요일에 따른 파생 변수를 생성하고, 순환적 시간 요소를 반영하여 데이터를 변환하는 방법을 배웁니다. 시계열 데이터의 정상성을 확보하고 ADF 테스트를 통해 이를 평가하며, ACF와 PACF 분석을 통해 시계열 데이터의 상관관계를 이해하고, 이를 기반으로 유용한 파생 변수를 생성하여 예측 성능을 향상시킵니다.

프로젝트 과정

차근차근 단계를 밟아 학습해보세요.

스테이지 4 개

1. 시계열 데이터와 Python datetime의 기초
2. pandas를 활용한 날짜 및 시간 데이터 처리
3. 시계열 데이터의 전처리 및 분석
4. 시계열 데이터 분석과 파생 변수 생성

내 학습 진도

1. 시계열 데이터와 Python datetime의 기초
데이스쿨 picture

데이스쿨

안녕하세요! 🙋‍♀️ 데이스쿨은 인공지능 초/중급 학습자를 위한 프로젝트 학습, 해커톤, 트랙으로 구성된 학습 플랫폼이에요. 부단한 연습과 매일의 작은 노력을 통해 여러분의 학습 목표를 달성해 보세요. 🏆 여러분의 성공을 위해 데이스쿨이 함께 할게요. 🎉 📧 문의: dacon0school@gmail.com

더보기