커뮤니티 대회 교육

월간 데이콘 코로나 데이터 시각화 AI 경진대회

분석시각화 | 정형 | 분석 | 코로나 | 정성평가

  • moneyIcon 상금 : 250만원
  • 2,267명 마감

 

[COVID-19 Analysis & Visualization] 뭉치면 죽고 퍼지면 산다!

2020.04.22 21:26 9,899 조회 language

[Tableu Board] 국내 확진자와 세계 확진자 추이입니다.  날짜 스크롤을 움직이거나 제목 밑의 버튼을 각각 클릭하면 인터렉티브한 확진자 추이를 보실 수 있습니다. :)

TABLEAU
코드
a낙타a
2020.04.24 16:13

그래프가 깔끔하고 세련되보이네요, Plotly도 공부해봐야할것 같습니다 ^0^

Python
2020.04.26 19:54

감사합니다. plotly 정말 강력하고 좋은 시각화 라이브러리라 생각해요. plotly doc 보시고 따라하시면 생각보다 쉽게 적용하실 수 있을 것입니다!!

Geonwoo_Kim
2020.05.01 23:14

코로나에 대한 경각심이 낮은 20대와 코로나에 취약한 계층인 60대로 나누어 분석해서 그런지 결과에 흥미로운 점들이 많네요. ^_^

데싸가쥬앗
2020.05.01 23:50

감사합니다~! 모든 사람이 현재 가장 경각심을 가져야할 집단을 인지해야 큰 피해없이 예방할 수 있다고 생각되었습니다. 그래서 확진자와 사망자의 주요 집단을 중점으로 두어 분석작업에 임하였습니다.

피컴화이팅
2020.05.06 19:22

내용이 알차고 시각화가 너무 잘 되어있어서 가독성이 높아지는 글이네요! 감사합니다~

Python
2020.05.06 20:14

감사합니다 ! 마지막까지 더 알찬 내용으로 업데이트 계속해나가겠습니다 ㅎㅎ

Visualising Korea
2020.05.10 17:48

게시물이 예전보다 많이 향상되었네요. 특히 도입부 부분에 결과를 요약한 섹션을 둔 것이나 요약 섹션의 구조와 워딩, 주요 결과를 빨간색으로 하이라이트 하는 등 결과를 소개하는 면에서 저희 게시물이 많이 참조가 된 것 같아 보기가 좋습니다.

데싸가쥬앗
2020.05.10 20:54

마지막으로 글의 가독성을 높이기 위해 비쥬얼 코리아외 다른 팀의 게시물을 참고하며 글 구조를 재 수정하였습니다!  확실히 현업에 계신 분의 글이라서 그런지 글의 구조 및 짜임에서 많은 배움을 얻을 수 있었습니다. 감사합니다.

Visualising Korea
2020.05.10 17:48

그런데 게시물의 분석 결과와 시각화를 인사이트라고 부르는 이유가 무엇인지요? 나이가 많고 기저질환이 있는 사람들이 특히 위험한건 중국에서 바이러스가 퍼지기 시작할 때부터 알려진 사실 아닌가요? 한국의 코로나19 후반기 확진자 대부분이 해외유입인 것도 마찬가지구요. 미디어에서 매일 얘기하는 내용인데, 꼭 시각화하지 않아도 다 알 것 같은데요..? 모든 사람들이 다 아는 내용을 인사이트라고 부를 수 있을지는 좀 의문이네요. 

Visualising Korea
2020.05.10 17:48

특히 저희 게시물에 질병 변수의 결측치와 관련해 연구 논문을 참조하셨다는 답글을 다셨길래 그 부분을 유심히 봤는데, 연구 논문이 분석에 어떻게 어우러지고 있는지 잘 안보이네요. 연구논문은  여러 기저질환을 가진 사람들이 코로나 바이러스로 인한 사망 위험이 있다는 것을 언급하는데 쓰인게 다인가요? 기저질환이 코로나 바이러스에 위험하다는건 꼭 연구논문을 가져오지 않더라도 다 알려진 사실일텐데요..?

Visualising Korea
2020.05.10 17:55

연구 논문에 근거한 것도 아니라면, 위의 분석만으로 “사망 환자 중 기저질환을 앓고 있던 환자가 30%”라고 결론을 내리기에는 근거가 많이 부족해보입니다. 그 30%는 사망자 중 disease의 True값을 지닌 사람들의 비율일 뿐이고, 나머지 70%가 False라고 가정했을 때 성립되는 비율입니다. 하지만 데이터에서disease가 True가 아닌 값은 False 가 아니라 nan이죠. 이 중 실제로 질병이 있었으나 기록되지 않은 사람들이 있었다면요? 여기에 대해서 더 생각해보셔야 할 것 같습니다. 

데싸가쥬앗
2020.05.10 22:10

우선적으로 말씀드리자면 5시부터 데이콘 웹 서버 접속이 원할하지 않아 최종 수정본 이전의 글을 보신것 같습니다. 
첫번째로 저희는 뉴스에서 기저질환 많은 사람이 취약하다고 해서 취약하다는 내용을 근거로 분석을 진행하거나, 해외 유입이 많다고해서 해외 유입이 많다고 하는 것은 제가 생각하는 데이터 분석과 방향과 다르다고 생각합니다.

데싸가쥬앗
2020.05.10 22:31

또한, 해외 유입이 많은 것은 다들 알고계시는 사실입니다. 하지만, 실제로 위협적인지?에 대해서 생각해보면 오히려 집단 감염이 더 위협적이다는 결론을 저희는 내렸습니다.  해외유입에 대한 내용은 글의 구조를 위해서 발판역할로 넣어주었습니다. 저희 글의 최종결론은 집단 감염이 가장 경계해야하는 대상이라는 것입니다. 실제로 몇일 전 연휴기간 이태원에서 집단감염으로 인한 확진자수가 급증한것을 볼 수 있었습니다.

데싸가쥬앗
2020.05.10 22:12

두번째 기저질환 관련으로는 이전 글의 patientinfo 상의 약 60명의 환자정보의 질병유무에 따라 30%가 기저질환이 있었다라고 일반화할 순 없어 논문 관련한 자료를 중심으로 많이 조사와 참고를 하여 분석을 진행했습니다. 하지만, 정확하게 해당 부분을 설명할 순 없다고 판단하였고 논문 대신 질병관리본부에서 발표한 정확한 근거를 사용하여 최종 수정을 하였습니다. 해당 자료는 사망자의 대한 정보를 가져와 98.8%에 기저질환이 있었다는 내용입니다. 저희 글을 꼼꼼히 읽어주시고 해당 글에 대해 질문 남겨주셔서 감사합니다!

로그인이 필요합니다
0 / 1000