분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
연령대별 방문자 선호를 파악하여 맞춤형 콘텐츠 전략과 마케팅 방향 수립, 데이터 기반 의사결정 지원
데이터 불러오기
기사 데이터, 콘텐츠 메타데이터, 인구통계 데이터, 유입 경로 데이터를 엑셀에서 불러왔다.
데이터 병합
article_id와 period 기준으로 모든 데이터를 하나의 데이터프레임으로 통합했다.
연령대 × 카테고리 집계
연령대와 카테고리별로 조회수, 좋아요, 댓글, ratio를 합산했다.
Engagement score를 계산해 콘텐츠 반응도를 수치화했다.
연령대별 비율 계산
각 연령대 내에서 카테고리별 조회수 비율을 계산했다.
전체 카테고리 비중 계산
전체 방문자를 기준으로 카테고리별 조회수 비중을 산출했다.
Lift(상대선호지수) 계산
연령대 내 비율을 전체 카테고리 비중으로 나누어 Lift를 구했다.
Lift가 1보다 높으면 평균보다 선호도가 높음을 의미한다.
Heatmap 시각화
연령대 × 카테고리 Lift를 히트맵으로 시각화했다.
시각화 결과를 PNG 파일로 저장했다.
통계적 유의성 검정
Chi-square 검정을 통해 연령대와 카테고리 간 조회수 분포의 독립성을 검정했다.
p-value로 유의미성을 확인했다.
연령대별 키워드 분석
TF-IDF를 활용해 title+tag에서 상위 10개 키워드를 추출했다.
각 연령대별 관심사를 파악했다.
연령대별 자동 인사이트 생성
상위 3개, 하위 1개 카테고리와 Lift 기준으로 자동 문장을 생성했다.
보고서 형태로 바로 활용 가능하게 구성했다.
보고서 출력
연령대별 인사이트 문장과 상위 키워드를 출력했다.
Heatmap 파일과 통계 검정 결과도 함께 제공했다.
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
직업정보제공사업 신고번호: J1204020250004
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io |
전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved