2025 신문과 방송 독자 데이터 분석 아이디어 경진대회

아이디어 | 월간 데이콘 | 정형 | 데이터 분석 | 시각화 | 인사이트

  • moneyIcon 상금 : 한국언론진흥재단 이사장상
  • 474명 마감

 

유입경로 기반 독자 참여도 분석 및 콘텐츠 개선 인사이트

2025.10.30 20:00 113 조회 language

개발 언어는 Python을 사용하였으며 코드 순서는 데이터 로드, 데이터 구조 확인, 결측치 확인 및 처리, 데이터 맵핑 및 병합, 분석 변수 생성, 데이터분석&시각화 순으로 진행이 된다 사용 라이브러리는 pandas, numpy, matplot, Seaborn이다. 
1. 라이브러리 불러오기에선 데이터 분석과 시각화를 위해 주요 패키지를 불러오고, 그래프 깨짐 방지를 위해 한글 폰트를 윈도우 한글 폰트로 설정하였다.
2. 데이터 로드에선 3개의 주오 데이터 셋을 로드 하고 각각 기사, 유입 경로 , 기사 성과, 기사 메타정보를 담고 있다.
3. 결측치 처리에서는 category, content, date는 제거, comment 0으로 대체, tag는 공백으로 대체하였다.
4. 맵핑에선 URL정보를 바통으로 유입 경로를 5가지로 분류하였고 이후 핵심 변수 channel을 생성하였다.
5. 데이터 병합에서 article_id, period 기준으로 세 데이터를 병합하였고, validate='m:1'을 통해 데이터 유효성 검증을 수행하였다.
6. 주요 지표 계산은 각 기사 별 유입 기반 조회수와 참여율을 계산하였다.
7. 채널 별 총 조회수, 총 참여 수, 평균 참여율을 계산하고 트래픽 규모 기준으로 정렬하여 비교하였다.
8. 시각화에선 Bar Plot, Box Plot, Heatmap, scatter Plot, Line Plot을 사용하여 시각화 하였다.

PDF
코드