SRI 데이터 경진대회 : 수원시 정책 아이디어 제안

아이디어 | 데이터 | 분석 | 정책

  • moneyIcon 상금 1,000만 원
  • 477명 마감

 

제출합니다

2025.08.03 23:20 94 조회 language

Part 1. 데이터 전처리 및 분석용 데이터셋 구축
스크립트명: data_preprocessing_v4.1.py
역할: 원본 2024년 수원서베이 데이터의 복잡한 컬럼명을 정리하고, 분석에 필요한 타겟 변수(target_child_plan) 및 기본 변수(age)를 생성하여, 후속 분석의 기반이 되는 suwon_survey_2024_final.csv 파일을 생성합니다.
핵심 기술: Pandas를 이용한 데이터 정제, 컬럼명 클리닝, 조건 기반 변수 생성.

Part 2. 정책 변수 민감도 분석 (핵심 레버리지 탐색)
스크립트명: sensitivity_analysis_v2.py
역할: 훈련된 모델을 활용하여, 어떤 정책 변수를 개선하는 것이 가장 높은 효율(ROI)을 보이는지 탐색하는 '민감도 분석'을 수행합니다. 이를 통해 '원천동(DM32_34)'이 핵심 레버리지임을 발견했습니다.
핵심 기술: 모델 기반 민감도 분석, 자동화된 시나리오 테스트, Matplotlib/Seaborn 시각화.

Part 3. 시민 인식 텍스트 마이닝 (감성 바로미터 프로토타입)
스크립트명: sentiment_final_analyzer_v2.py
역할: SRI 시민패널 데이터의 주관식 응답을 분기별/통합하여 텍스트 마이닝을 수행하고, 워드클라우드를 통해 시민들의 핵심 인식을 시각화합니다.
핵심 기술: 텍스트 데이터 전처리, 단어 빈도 분석, WordCloud 시각화.

대회 운영정책에 따라 수상자의 제출물을 제외한 제출물은 공개되지 않습니다.