[스터디 5기 정규반 1조 첫째주 주말] 숙제인증

2024.02.19 05:07 462 Views
  • 'keyword'와 'referral_path' 변수들은 'traffic_medium'변수에 조건이 있기 때문에 해당 조건을 충족하지 않는 경우에는 결측값이 발생함.

    

  • 대부분의 연속변수들의 값은 0 혹은 1값에 모여있기 있고, 높은 값에서 많은 이상치를 가지고 있음

  • 세션의 질(quality)이 높을수록 조회수가 증가함: 높은 세션의 질은 사용자가 해당 웹사이트에서 더 많은 콘텐츠를 탐색하며 상호작용할 가능성이 높다는 것을 의미하므로 높은 조회수를 가져다 줄 수 있음.
  • 총 세션 시간(duration)이 길수록 조회수가 증가함: 더 긴 세션 기간은 사용자가 웹사이트에서 더 많은 시간을 보내고, 더 많은 콘텐츠를 소비할 가능성이 높다는 것임으로 조회수가 증가할 수 있음.

  • 평균적으로 미국과 캐나다(북미)에서 일어난 세션의 조회수가 높음:  해당 지역의 사용자들이 웹사이트에 자주 방문하고, 더 많은 상호작용을 하며, 콘텐츠를 소비하는 경향이 있을 수 있음

  • 평균적으로 organic(traffic_medium), google(traffic_source)로 유입되었을 때 조회수가 높음: 사용자들은 해당 웹사이트에 관심이 있고, 원하는 정보를 찾기 위해 자발적으로 방문하는 경우 조회수가 높아지는 것으로 보임

  • 평균적으로 재방문한 사용자의 조회수가 더 높음: 재방문한 사용자들은 이미 웹사이트에 대한 이해와 관심이 있다는 것을 암시하기 때문에 조회수가 새방문자에 비해 높은 것으로 보임