분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
어떤 프로젝트일지 시작하기 전에 읽어보세요
이 교재는 시계열 데이터 분석에서 패턴 발견부터 실제 예측 모델 구축까지의 전체 과정을 실습 중심으로 학습할 수 있도록 구성된 종합 가이드입니다. 2024년 택시 수요 데이터를 활용하여 EDA(탐색적 데이터 분석)에서 시작해 예측 모델링과 성능 평가까지 시계열 분석의 완전한 워크플로우를 체험할 수 있습니다.
택시 수요 예측은 시계열 분석의 핵심 개념들을 자연스럽게 학습할 수 있는 최적의 주제입니다. 월별 계절성(12월 최고 vs 8월 최저), 시간대별 일일 사이클(18시 피크 vs 3시 최저), 요일별 주간 사이클(평일 vs 주말 68% 차이) 등 다층적인 시간 패턴들이 명확하게 드러나며, 이러한 패턴들이 실제 예측 모델에서 어떻게 활용되는지 직접 확인할 수 있습니다.
전체적인 모델링 프로세스를 다루면서 시간 순서를 고려한 올바른 Train/Test 분리, 시간 기반 피처 엔지니어링, 여러 예측 모델의 구현과 비교, MAE와 SMAPE 등 다양한 평가 지표 활용, 그리고 모델 성능의 시각적 비교까지 경험할 수 있습니다.
특히 동일한 데이터에 대해 단일 피처 모델(시간만, 요일만)과 결합 피처 모델(시간+요일)의 성능을 정량적으로 비교함으로써, 모델 성능의 차이를 체감할 수 있습니다. SMAPE 기준으로 시간별 모델 42.43%, 요일별 모델 85.07%, 결합 모델 32.17%의 성능 차이를 통해 데이터 기반 의사결정의 중요성을 깊이 있게 이해할 수 있습니다.
시계열 데이터에서 시간 순서를 고려한 올바른 Train/Test 분리 방법을 적용하여 데이터 리키지를 방지할 수 있어요
MAE와 SMAPE 두 가지 평가 지표를 구현하고 활용하여 모델 성능을 다각도로 평가할 수 있어요
단일 피처 모델과 결합 피처 모델의 성능을 비교하여 피처 엔지니어링의 실질적 효과를 검증할 수 있어요
실제값과 예측값의 시각적 비교를 통해 모델의 예측 패턴을 분석하고 개선점을 도출할 수 있어요
시계열 EDA에서 발견한 패턴들이 실제 예측 모델에서 어떻게 활용되는지 이해하고 싶은 분
MAE, SMAPE 등 다양한 평가 지표의 차이점과 각각의 장단점을 실제 데이터로 비교해보고 싶은 분
복잡한 딥러닝 모델을 배우기 전에 단순한 통계 기반 예측 모델부터 차근차근 이해하고 싶은 분
피처 엔지니어링의 효과를 정량적으로 측정하고 검증하는 방법을 배우고 싶은 분
차근차근 단계를 밟아 학습해보세요.
스테이지 5 개

안녕하세요! 🙋♀️ 데이스쿨은 인공지능 초/중급 학습자를 위한 프로젝트 학습, 해커톤, 트랙으로 구성된 학습 플랫폼이에요. 부단한 연습과 매일의 작은 노력을 통해 여러분의 학습 목표를 달성해 보세요. 🏆 여러분의 성공을 위해 데이스쿨이 함께 할게요. 🎉 📧 문의: dacon0school@gmail.com
더보기