[세소식] 3편. COVID-19 확진자 수 예측

2022.01.25 13:56 1,368 조회

[세소식] 3편. COVID-19  확진자 수 예측


 세상의 다양한 AI 새 소식, 세소식

출처 - cdc.gov/coronavirus/2019-ncov/covid-data/covid-net/purpose-methods.html


2019년 말부터, 전세계적으로 유행하기 시작한 COVID-19의 영향으로

현재까지 많은 사람들이 고통을 받고 있습니다.

 

최근 들어서는 다시 신규확진자 수가 급증하였고

사회적 거리두기가 재시행되었죠.

 

이에 따라서

신종 코로나바이러스 감염증의 확산방지를 위하여

바이러스 확신 및 추적 기술 또한

점점 발전해 나가고 고도화 되어가고 있습니다.

 

오늘은 이에 관련하여 설명을 드리고자 합니다.

이번에 소개해 드릴 주제는 COVID-19 확진자 수 예측 모형입니다.

 

1.    코로나19 사태 전망

2.    코로나19 해외유입 확진자 수 예측 모델

3.    AI Hi-COVIDNet 모델 설명

4.    오미크론 변이 영향을 반영한 코로나19 발생 예측 모델

 

* 본 포스팅은 데이콘 서포터즈 “데이크루" 1기 활동의 일환입니다.



1. 코로나19 사태 전망

 

2019년도부터 현재 2022년도까지 신종 코로나 바이러스 감염증(코로나19)가 확산된지

3년 차에 접어들면서 추세를 지켜봤을 때

이러한 바이러스 사태의 앞으로의 전망은 어떻게 될까요?

올해는 종식이 가능할까요?

 

 출처 - biz.chosun.com/it-science/bio-science/2022/01/04/XPQ7YFVPI5EO5GNGNBTRX4LJFY/


최근 오미크론 변이가 빠르게 확산되고 있으면서

델타변이 등 기존 변이보다 증상이 약하다는 연구가 나오고 있습니다.

1918년 미국 시카고에서 최초 발생한 스페인 독감은 1920년에 종식 된 것처럼

코로나가 종식 될 것이라는 희망은 커져가고 있죠.

 

하지만 국내 호흡기 감염 전문가들은 완전 종식은 불가능하다고 하였습니다.

다만 일부 전문가들은 코로나 바이러스가 독감처럼 일상과 공존하는

‘위드 코로나’는 가능할 것으로 예상하고 있죠.

 

오미크론 변이에 기존 백신의 부스터샷(추가접종)이 효과가 있고,

먹는(경구용) 치료제가 나온 만큼 코로나 바이러스도 통제가 가능할 것이라는 거죠!

 

하지만 끊임없이 변이가 발생하고 있는 와중에

오미크론 변이보다 강력한 변이 바이러스가 출현하여

또 다른 팬데믹이 발생할 가능성은 배제할 수 없다고 합니다.

전문가들은 다음과 같이 연내 코로나19 종식 가능성을 내다보았습니다. 

 출처 - biz.chosun.com/it-science/bio-science/2022/01/04/XPQ7YFVPI5EO5GNGNBTRX4LJFY/



2. 코로나19 해외유입 확진자 수 예측 모델

 

그렇다면 이러한 코로나19 바이러스 확산 방지를 위하여

국내에서는 어떤 AI 기술을 사용하여 코로나19 방역에 도움을 줄 수 있었을까요?

 

한국과학기술원(KAIST) 산업및시스템공학과 이재길 교수 연구팀에서는

코로나19 해외유입 확진자 수를 예측하는 빅데이터를 이용한 AI 기술을 개발 하였습니다.

 

 

출처 – KAIST 공식 홈페이지 연구 뉴스

 

해외 각국의 확진자 수와 사망자 수, 해외 각국에서의 코로나19 관련 키워드 검색빈도,

한국으로의 일일 항공편 수와 해외 각국에서 한국으로의 로밍 고객 입국자 수 등을

데이터로 이용하여 딥러닝을 적용해

향후 2주간의 해외유입 확진자 수를 예측한다고 합니다.

 

이렇게 개발한 모델을 ‘하이코비드넷(Hi-COVIDNet)’이라고 이름을 붙였습니다.

 

연구팀이 Hi-COVIDNet을 활용해

20년 3월 22일부터 5월 5일까지 학습한 데이터를 바탕으로

이후 2주 동안(5월 6∼19일)의 해외유입 확진자 수를 예측한 결과

실제 확진자 수(하루 3∼11명)와의 오차가 2∼3명 정도밖에 나지 않았다고 합니다.

 

연구진들은 이. 모델이 시계열 데이터기반의 예측 기계학습이나.

기존의 딥러닝 기반의 모델과 비교했을 때

최대 35% 더 높은 정확성을 지니고 있음을 확인하였습니다.

 

제1 저자 김민석 박사과정 학생은 이렇게 말하였습니다.

”이번 연구는 최신 AI 기술을 코로나19 방역에 적용할 수 있음을 보여준 사례입니다.ˮ

 


3. AI Hi-COVIDNet 모델 설명

 

그럼 이 Hi-COVIDNet 은 어떤 모델일까요?

출처 – Hi-COVIDNet: Deep Learning Approach to Predict Inbound COVID-19 Patients and Case Study in South Korea 논문 中

 

논문을 참고하여 모델 구조를 간략하게 살펴보겠습니다.

그림에서 보시면 두가지 Level 모델 아키텍처(Country-Level Encoder, Continent-Level Encoder)와

마지막 Predictaion Layer가 존재 한다는 것을 알 수 있습니다.

 

1) Country-Level Encoder

여기서는 각 국가의 감염 위험과 각 국가의 유입 추세에 대한 숨겨진 인자들을 학습을 합니다.

Transformer에 들어가는 Daily Epidemic 변수로

확진자와 사망자와. 같은 전염병 통계에서의 검색 키워드를 통해서 감염 위험의 인자로 두고,

LSTM 학습 방법을 기반으로 하여 학습을 시킵니다.

그리고 Inflow 변수로

로밍 및 비행 통계 데이터를 통하여 각 국가의 유입 추세를 인자로 두었습니다.

그렇게 이러한 두개의 측면의 기능을 하는 inputs을 연결을 해주었습니다.

 

2) Continent-Level Encoder

여기서는 코로나19의 확산이 인접국의 영향을 많이 받으므로

같은 대륙에 속한 국가별로 인코더의 출력을 집계합니다.

따라서 대륙별로 Concatenate를 해주고 마지막으로 Fully Connected Layer를 사용하여

모든 노드를 완전히 연결 되도록 만듭니다.

Fully Connected Layer 구조 / blog.naver.com/PostView.nhn?blogId=intelliz&logNo=221709190464


3) prediction layer

마지막으로 Fully Connected Layer를 다시한번 사용하여

모든 대륙의 히든 노드를 결합하고 최종 출력에 대한 각각의 기여도를 학습하여

다가오는 𝑘일 동안 한국으로 유입된 코로나 확진자 수 y hat을 반환합니다.


 

4.    오미크론 변이 영향을 반영한 코로나19 발생 예측 모델

 

최근 KIST에서 오미크론 변이의 영향을 반영하여 분석한

코로나19 발생 확진자 수를 예측하는 모형도 개발하였습니다.

출처 - ncov.mohw.go.kr/upload/140/202112/1640925309122_20211231133509.pdf

 

모델링은 질병관리청 등 각 부처들의 협조로

‘코로나 방역 DB’(역학조사 결과, 카드매출, 이동통신 정보 등)를 구축하고,

주어진 상황에서 개인의 이동과 모임 등의 행태를 고려하여

사회 전체 감염 현상을 반영한 인공지능 예측 모형이라고 합니다.

 

자세한 모형에 대한 설명이나 논문은

열심히 찾아보았지만 아직 공개되지 않았지만,

 

이 모형은 행위자 기반 모형 이라고 하는데요,

개인 수준 속성을 다양한 변수(이동, 건강정보, 교통 및 사회∙의료정보 등의 빅데이터)로

설계, 반영하여 주변 환경에 따른 개인의 행위와 감염여부를

추계적으로(stochastic) 분석하고 거대 규모로 계산하는 모형이라고 합니다.

 

 

 

우리는 이번 시간에 코로나 해외유입 확진자 수 예측 모형

오미크론 변이 영향을 반영한 코로나19 발생 예측 모형을 알아보았습니다.

 

KAIST의 Hi-COVIDNet, 그리고 KIST의 행위자 기반 모형과 같이

빅데이터와 AI를 이용하여 코로나19 바이러스를 효율적으로

방역 지침을 개선하고 있다는 것을 알아보았습니다.

 

모두가 각자의 분야에서 열심히 노력하여

이 팬데믹을 무사히 극복하였으면 하는 바람입니다 :)

 



 

참고 :  

https://biz.chosun.com/it-science/bio-science/2022/01/04/XPQ7YFVPI5EO5GNGNBTRX4LJFY
https://blog.naver.com/PostView.nhn?blogId=intelliz&logNo=221709190464
https://news.kaist.ac.kr/news/html/news/?mode=V&mng_no=9551&skey=keyword&sval=Hi-COVIDNet&list_s_date=&list_e_date=&GotoPage=1
http://ncov.mohw.go.kr/upload/140/202112/1640925309122_20211231133509.pdf
https://dm.kaist.ac.kr/lab/papers/kdd20_covid.pdf


 


로그인이 필요합니다
0 / 1000
_pxmgu
2022.01.25 17:34

트랜스포머 구조를 활용해서 코로나 예측 아키텍처를 만들다니 매우 흥미롭네요 좋은 정보 감사합니다 :)

월드파파
2022.01.26 09:11

감사합니다 :)

백남진
2022.01.26 11:43

카이스트의 Hi-COVIDNet 대단하네요. 덕분에 지식 쌓을 수 있었습니다 감사합니다 !

월드파파
2022.01.26 17:48

저도 찾아보면서 모델링 보고 감탄했습니다 ..! 감사합니다 ㅎㅎ

sssssun
2022.01.26 15:51

9시 4인 거리두기 제도가 어쩌면 빅데이터 분석의 결과일 수도 있다는 것이 놀랍네요.. 너무 흥미롭게 잘 읽었습니다! 

월드파파
2022.01.26 17:50

실제로 저 KIST 모델을 근거로 하여 거리두기를 정하였다고 하네요 ! 잘 읽으셨다니 뿌듯하네요. 감사합니다 :)