월간 데이콘 코로나 데이터 시각화 AI 경진대회

분석시각화 | 정형 | 분석 | 코로나 | 정성평가

  • moneyIcon 상금 : 250만원
  • 2,322명 마감

 

Who is 슈퍼전파자? 날씨가 더워지면 코로나 극복?

2020.04.09 18:14 7,321 조회 language

코로나의 집단감염을 일으킨 슈퍼전파자를 추적하는 주제, 그리고 날씨와 코로나의 관련성을 주제로 선정해보았습니다.

사회적 거리두기가 핵심예방 방법인 코로나임에도 불구하고 집단감염을 일으킨 슈퍼전파자의 환자정보가 무엇인지 추적해보고 싶었습니다. 그리고
이번에는 화려한 그래프보다는 개별적으로 독립된 데이터들을 어떻게 하나의 데이터프레임으로 합칠 수 있을까에 대해서 많이 고민해보았습니다.
그래서 결정한 주제는 날씨와 코로나와의 관련성인데 결론적으로는 개인적인 분석 후 판단상 크게 관련성이 없는 것으로 나오게 되었습니다.

코드 앞쪽에는 시도별 노인비율이 얼마나 존재하는지 간단하게 알아보는 코드이고 그 이후부터 본격적인 주제 2개에 대한 코드가 작성되어있습니다.

날씨와 코로나의 관련성을 분석하기 위해 시도한 도전은 Timeprovince라는 데이터와 weather이라는 데이터 두개가 공통 칼럼인 date(날짜)와 province(시도) 공통칼럼을 기준으로 결합하고 이를 시각화 해보는 것이였습니다. 사실 크게 상관성이 있는 결과가 나오지 않아 전처리를 하는 데 노력이 많이 들어서 그런지 살짝 허무하기도 했습니다.

끝으로 제가 날씨와 코로나와의 관련성을 시각화 하기 위해서 seaborn의 lineplot만 이용했는데 다른 분들이 보시기에 더 좋은 그래프 방법과
또 다른 관련성을 찾아낼 수 있을 것 같다고 생각하시면 적극적인 피드백은 언제나 환영입니다 :) 그러면 긴 코드 읽어주셔서 감사드립니다!

코드