분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[팀명:CK] [포로젝트명:뉴스 콘텐츠 유입경로별 반응 효율 분석]
코드 개요
‘뉴스 콘텐츠 유입경로별 참여 효율(Engagement Efficiency)’을 분석하는 것을 목표로 합니다.
1. 기본 세팅 및 데이터 로드
세 개의 데이터셋(contents, referrer, metrics)을 불러와서 구조를 확인합니다.
각 데이터셋에는 기사 정보, 유입경로 정보, 반응 지표(조회·좋아요·댓글)가 포함되어 있습니다.
2. 데이터 전처리
컬럼명 통일(content_id) 후 세 데이터셋을 기준키로 병합(Left Join).
결측치 점검: 비핵심 변수는 제외, 핵심 지표는 0으로 대체.
전체 결측률 1% 미만 → 데이터 품질 우수.
3. 변수 정의 및 파생 변수 생성
좋아요율 like_rate = likes ÷ views
댓글율 comment_rate = comments ÷ views
효율지수 Engagement Efficiency = like_rate ÷ (views / 평균조회수)
→ 조회 대비 참여 효율을 정량화한 핵심 지표.
4. 주요 분석
4.1 분포 분석: 카테고리별 기사 비중 및 유입경로별 반응 비교
4.2 교차 분석: referrer × category 조합별 조회·좋아요율 Heatmap
4.3 트렌드 분석: 월별 조회수·좋아요 변화 및 증감률 분석
5. 효율지수 및 인사이트
유입경로와 카테고리별 효율지수를 계산하여 참여 효율이 높은 조합 식별.
단순 조회 중심이 아닌 참여 중심의 뉴스 소비 구조를 정량적으로 제시함.
6. 요약
“데이터 통합 → 파생 변수 → 시각화 → 효율 분석”의 흐름으로
뉴스 소비의 참여 효율성을 측정하고 플랫폼별 전략 인사이트를 도출한 분석 코드.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved