2025 신문과 방송 독자 데이터 분석 아이디어 경진대회

아이디어 | 월간 데이콘 | 정형 | 데이터 분석 | 시각화 | 인사이트

  • moneyIcon 상금 : 한국언론진흥재단 이사장상
  • 474명 마감

 

'신문과방송'으로 이어지는 여정, 같이 올래?

공동작성자

stroke
2025.10.31 01:37 159 조회 language

0. 준비 :
- pandas, matplotlib, seaborn 임포트
- 한글 폰트 및 파일 경로 설정

1. 1차 EDA :
- metrics, contents 병합
- [1-1] 인기 기사 TOP 10 (조회수) 추출
- [1-2] 인기 카테고리 TOP 10 (평균 조회수) 시각화

2. [1단계: 현상 분석] 위기 진단
- 월별 전체 조회수, 좋아요, 댓글 합계 계산
- 3개 지표 시계열 그래프 시각화
- [목적] '우하향' 쇠퇴 추세 확인

3. [2단계: 원인 분석] 콘텐츠 문제인가?
- [가설 1] 주제 문제? -> '흥행의 달' vs '부진의 달' 태그 비교 (결과: 일관됨, 주제 문제 아님)
- [가설 2] 형식 문제? -> '기사 길이' vs '조회수' 상관관계 분석 (결과: 약한 양의 상관, 긴 글 문제 아님)
- [가설 3] 유입 문제? -> '연령대별 월별 조회수' 시계열 시각화 (결과: 신규(Z/시니어) 유입 0에 수렴, 핵심 원인)
- [가설 4] 경로 문제? -> '검색'/'블로그' 유입 횟수 시계열 시각화 (결과: '검색' 유입 하락, 경로 제약 명백)

4. [3~4단계: 타겟 확정] '50대 이상 시니어' 발견
- '우량 타겟' 탐색
- [분석] 1) 연령별 총 조회수, 2) '좋아요' 참여율, 3) '댓글' 참여율
- [시각화] 3개 그래프 '나이순' 정렬, '50대 이상' 파란색 강조 
- [목적] '방문율' 최하위(기회) vs '참여율' 최상위(잠재력)인 '50대 이상' 타겟 확정

5. [4(심층): 타겟 분석] 시니어 니즈(Needs) 파악
- '50대 이상' 데이터 필터링
- '선호 카테고리 TOP 10' (조회수) 분석
- [목적] 취재기·제작기 등 '깊이 있는' 콘텐츠 선호 확인

PDF
코드