분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
유입경로 기반 독자 참여도 분석 및 콘텐츠 개선 인사이트
개발 언어는 Python을 사용하였으며 코드 순서는 데이터 로드, 데이터 구조 확인, 결측치 확인 및 처리, 데이터 맵핑 및 병합, 분석 변수 생성, 데이터분석&시각화 순으로 진행이 된다 사용 라이브러리는 pandas, numpy, matplot, Seaborn이다.
1. 라이브러리 불러오기에선 데이터 분석과 시각화를 위해 주요 패키지를 불러오고, 그래프 깨짐 방지를 위해 한글 폰트를 윈도우 한글 폰트로 설정하였다.
2. 데이터 로드에선 3개의 주오 데이터 셋을 로드 하고 각각 기사, 유입 경로 , 기사 성과, 기사 메타정보를 담고 있다.
3. 결측치 처리에서는 category, content, date는 제거, comment 0으로 대체, tag는 공백으로 대체하였다.
4. 맵핑에선 URL정보를 바통으로 유입 경로를 5가지로 분류하였고 이후 핵심 변수 channel을 생성하였다.
5. 데이터 병합에서 article_id, period 기준으로 세 데이터를 병합하였고, validate='m:1'을 통해 데이터 유효성 검증을 수행하였다.
6. 주요 지표 계산은 각 기사 별 유입 기반 조회수와 참여율을 계산하였다.
7. 채널 별 총 조회수, 총 참여 수, 평균 참여율을 계산하고 트래픽 규모 기준으로 정렬하여 비교하였다.
8. 시각화에선 Bar Plot, Box Plot, Heatmap, scatter Plot, Line Plot을 사용하여 시각화 하였다.
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved