분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[순천향대 김성준]2025 신문과 방송 독자 데이터 분석 아이디어 경진대회
정치 키워드를 중심으로 한 정치 기사 반응 분석입니다.
이 코드는 뉴스 기사 데이터를 활용하여 정치 키워드가 포함된 기사들에 대해 독자 반응을 분석하고, 반응이 높은 키워드를 시각화하는 프로젝트입니다. 먼저, 정치면 고빈도 키워드 상위 200개를 불러오고, 기사 제목, 태그, 카테고리, 본문을 결합한 전체 텍스트에 해당 키워드가 포함되어 있는지를 기준으로 정치 기사를 분류합니다. 그 후 각 기사별로 월별 반응 지표(조회수, 공감수, 댓글 수)를 합산하고, 정치 기사와 병합하여 반응 데이터를 연결합니다. 분석의 정확도를 높이기 위해 ‘윤석열’과 ‘윤석열 대통령’, ‘더불어민주당’과 ‘민주당’ 등 의미가 같은 키워드를 통합 처리하였고, 중복 키워드를 제거한 최종 키워드 목록을 기준으로 키워드별로 기사들의 평균 조회수, 공감수, 댓글 수를 계산하였습니다. 마지막으로 세 반응 지표별로 상위 10개 키워드를 추출하고 각각 시각화하여, 어떤 정치 키워드가 독자들의 높은 관심과 반응을 이끌어내는지 명확히 보여줄 수 있도록 구성하였습니다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved