2025 신문과 방송 독자 데이터 분석 아이디어 경진대회

아이디어 | 월간 데이콘 | 정형 | 데이터 분석 | 시각화 | 인사이트

  • moneyIcon 상금 : 한국언론진흥재단 이사장상
  • 67명 종료까지 D-38

설명

Dataset Info.

  • contents.xlsx[파일]
  • post_id: 게시물 고유 식별자(ID)  
  • category: 게시물이 속한 카테고리(예: 커버스토리, 취재기·제작기)  
  • title: 게시물 제목  
  • content: 게시물 본문 텍스트  
  • date: 게시물 작성일자
  • tag: 게시물 태그 키워드
  • source_url: 게시물 원문 URL  
  • article_metrics_monthly.xlsx[파일]
  • article_id: 기사 고유 식별자(ID)  
  • period: 집계 기준 기간((YYYY-MM 형식, 월 단위)  
  • comments: 해당 월 동안 기사에 달린 댓글 수  
  • likes: 해당 월 동안 기사에 기록된 공감 수  
  • views_total: 해당 월 동안 기사 조회수
  • referrer.xlsx[파일]
  • article_id: 기사 고유 식별자(ID)  
  • article_title: 기사 제목  
  • period: 집계 기준 기간(YYYY-MM 형식, 월 단위)  
  • referrer: 유입 경로 대분류(예: 네이버 블로그_PC, 네이버 블로그_모바일 등)  
  • referrer_detail: 세부 유입 경로(예: 검색어, 유입 링크 등)  
  • share: 해당 유입경로를 통한 조회수 비율(%)  
  • demographics_part001.xlsx, demographics_part002.xlsx[파일]
  • article_id: 기사 고유 식별자(ID)  
  • period: 집계 기준 기간(YYYY-MM 형식, 월 단위)  
  • age_group: 연령대(예: 10대, 20대, 30대 등)  
  • gender: 성별(남, 여)  
  • views: 해당 연령/성별 그룹에서의 조회수  
  • ratio: 전체 조회수 대비 특정 연령/성별 그룹이 차지하는 비율(%) 

* 해당 데이터는 신문과 방송 블로그의 2020년 1월~2025년 7월 게시글에 대한 것이며, article_metrics_monthly.xlsx,referrer.xlsx,demographics_part001.xlsx,demographics_part002.xlsx 등 이용자 데이터는 네이버 블로그가 최근 2년 간의 정보만을 제공하기에 2023년 7월~2025년 8월을 기준으로 작성됐음을 알려드립니다.


※ 제공드리는 데이터를 엑셀로 열람하는 경우, 데이터가 비정상적으로 보이는 현상이 발생할 수 있으니 반드시 Pandas패키지와 같은 데이터툴을 이용하여 열람부탁드립니다.

상세