2025 신문과 방송 독자 데이터 분석 아이디어 경진대회

아이디어 | 월간 데이콘 | 정형 | 데이터 분석 | 시각화 | 인사이트

  • moneyIcon 상금 : 한국언론진흥재단 이사장상
  • 474명 마감

 

[팀명:CK] [포로젝트명:뉴스 콘텐츠 유입경로별 반응 효율 분석]

2025.10.30 11:59 105 조회 language

코드 개요
‘뉴스 콘텐츠 유입경로별 참여 효율(Engagement Efficiency)’을 분석하는 것을 목표로 합니다.

1. 기본 세팅 및 데이터 로드
세 개의 데이터셋(contents, referrer, metrics)을 불러와서 구조를 확인합니다.
각 데이터셋에는 기사 정보, 유입경로 정보, 반응 지표(조회·좋아요·댓글)가 포함되어 있습니다.

2. 데이터 전처리
컬럼명 통일(content_id) 후 세 데이터셋을 기준키로 병합(Left Join).
결측치 점검: 비핵심 변수는 제외, 핵심 지표는 0으로 대체.
전체 결측률 1% 미만 → 데이터 품질 우수.

3. 변수 정의 및 파생 변수 생성
좋아요율 like_rate = likes ÷ views
댓글율 comment_rate = comments ÷ views
효율지수 Engagement Efficiency = like_rate ÷ (views / 평균조회수)
→ 조회 대비 참여 효율을 정량화한 핵심 지표.

 4. 주요 분석
4.1 분포 분석: 카테고리별 기사 비중 및 유입경로별 반응 비교
4.2 교차 분석: referrer × category 조합별 조회·좋아요율 Heatmap
4.3 트렌드 분석: 월별 조회수·좋아요 변화 및 증감률 분석

5. 효율지수 및 인사이트
유입경로와 카테고리별 효율지수를 계산하여 참여 효율이 높은 조합 식별.
단순 조회 중심이 아닌 참여 중심의 뉴스 소비 구조를 정량적으로 제시함.

 6. 요약
“데이터 통합 → 파생 변수 → 시각화 → 효율 분석”의 흐름으로
뉴스 소비의 참여 효율성을 측정하고 플랫폼별 전략 인사이트를 도출한 분석 코드.

PDF
코드