2025 신문과 방송 독자 데이터 분석 아이디어 경진대회

아이디어 | 월간 데이콘 | 정형 | 데이터 분석 | 시각화 | 인사이트

  • moneyIcon 상금 : 한국언론진흥재단 이사장상
  • 474명 마감

 

[순천향대 김성준]2025 신문과 방송 독자 데이터 분석 아이디어 경진대회

2025.10.30 20:50 126 조회 language

정치 키워드를 중심으로 한 정치 기사 반응 분석입니다.
이 코드는 뉴스 기사 데이터를 활용하여 정치 키워드가 포함된 기사들에 대해 독자 반응을 분석하고, 반응이 높은 키워드를 시각화하는 프로젝트입니다. 먼저, 정치면 고빈도 키워드 상위 200개를 불러오고, 기사 제목, 태그, 카테고리, 본문을 결합한 전체 텍스트에 해당 키워드가 포함되어 있는지를 기준으로 정치 기사를 분류합니다. 그 후 각 기사별로 월별 반응 지표(조회수, 공감수, 댓글 수)를 합산하고, 정치 기사와 병합하여 반응 데이터를 연결합니다. 분석의 정확도를 높이기 위해 ‘윤석열’과 ‘윤석열 대통령’, ‘더불어민주당’과 ‘민주당’ 등 의미가 같은 키워드를 통합 처리하였고, 중복 키워드를 제거한 최종 키워드 목록을 기준으로 키워드별로 기사들의 평균 조회수, 공감수, 댓글 수를 계산하였습니다. 마지막으로 세 반응 지표별로 상위 10개 키워드를 추출하고 각각 시각화하여, 어떤 정치 키워드가 독자들의 높은 관심과 반응을 이끌어내는지 명확히 보여줄 수 있도록 구성하였습니다.

PDF
코드