2025 신문과 방송 독자 데이터 분석 아이디어 경진대회

아이디어 | 월간 데이콘 | 정형 | 데이터 분석 | 시각화 | 인사이트

  • moneyIcon 상금 : 한국언론진흥재단 이사장상
  • 474명 마감

 

[정희영]콘텐츠 포맷 효율성 분석

2025.10.27 05:32 176 조회 language

1단계로 4개의 엑셀 파일을 불러옴 
첫 번째 파일은 기사의 제목, 내용, 카테고리 등 기사 자체의 정보를 담고 있고, 두 번째 파일은 기사의 조회수, 좋아요, 댓글 등 성과 데이터이며, 세 번째 파일은 독자가 PC로 봤는지 모바일로 봤는지에 대한 정보임.네 번째 파일은 독자의 연령대와 성별 정보임
2단계로 데이터 가공임 
기사 내용의 글자 수를 세어서 단문, 중문, 장문으로 분류하고, 기사의 카테고리와 제목을 보고 인터뷰, 데이터 리포트, 칼럼, 뉴스 등으로 자동 분류함.
월별로 흩어진 조회수와 좋아요 데이터를 기사별로 합산하고, 공감률(좋아요/조회수 비율)과 댓글률을 계산하고, PC와 모바일 유입 비율을 계산함.
3단계로 데이터 통합임
세 개의 가공된 데이터를 기사 ID를 기준으로 하나로 합치고, 최종적으로 천칠백여 개 기사의 모든 정보가 담긴 마스터 테이블을 만듬.
4단계로 분석 및 시각화임
먼저 포맷별(인터뷰, 리포트 등)로 어떤 것이 공감률이 높은지 막대그래프로 비교하고,  다음으로 길이별(단문, 중문, 장문)로 어떤 것이 효과적인지 막대그래프로 비교함.
그 다음 포맷과 길이를 동시에 고려한 교차 분석을 히트맵으로 표현함. 예를 들어 "중문 인터뷰"와 "장문 리포트" 중 어떤 조합이 더 좋은지 한눈에 볼 수 있음.
마지막으로 PC 사용자와 모바일 사용자가 선호하는 콘텐츠가 다른지 비교함

PDF
코드