MAILab2021
- Oct 19, 2021
- 6 min read

그래픽 데이터 분석과 예측은 “위드코로나” 성공의 키

2021.10.18. 지은이 양필승

1. 한국 제조업체 39% AI 활용 중? 구글 조사에 대한 문제점

2. 코로나 방역 기술, 특히 우리 AI는 너무나 보잘 것 없습니다!

3. 마스크가 일상화된 지금, 탈레반의 승리로 보안에 비상등이 켜졌습니다. 솔루션은 비전AI!

4. 델타변이와의 전쟁, 그래도 마스크 밖에 없다는데. 그 답은 AI!

5. 전자발찌 살인마 얼굴, “못 알아보게 바뀌었어도,” AI는 알아본다!

6. 페미니스트 AI, 물론 가능하고 당연합니다!

7. 당신의 AI는 계속 러닝이 가능합니까.

8. 시니어 AI, 시니어를 위한 AI가 아닌 시니어에 의한 AI

9. “착한 AI,” “좋은 AI,” 윤리적인 인공지능

10. 그래픽 데이터 분석과 예측은 “위드-코로나” 성공의 키

11. 인공지능의 꽃, 비전AI의 파워

인공지능의 두 가지 핵심 기능은 분석과 예측입니다. 특히 인공지능이 2012년부터 딥러닝의 발전으로 진입한 이래, 데이터를 분석하는 능력과 그에 터잡은 예측 능력이 획기적으로 제고되었습니다. 이 같은 변화는 알고리즘을 프로그래밍하는 능력이 뇌과학의 원리를 활용하여 고차원으로 향상되었을 뿐 아니라, 빅데이터를 단시간내에 학습할 수 있는 컴퓨팅 파워가 이전과 비교할 수 없는 수준으로 발전하였기 때문에 가능하였습니다.

이전까지 축적된 컴퓨터 기술, 특히 프로세서의 발달이 빠른 속도로 이뤄졌던 것입니다. 특히 그래픽 데이터를 처리할 수 있는 GPU가 대량 생산하게 되었습니다. 단순히 게임을 개발하고 즐기기 위해 필요했던 GPU가 이미지 데이터를 신속하게 처리할 수 있도록 대량으로 생산할 수 있기에 이른 것입니다. 물론 엄청난 금전적 투자가 있었기에 가능하였습니다.

빅데이터의 축적도 빼 놓을 수 없습니다. 그 만큼 디지털시대로 진입하였기 때문에 가능하였던 것입니다. 특히 스마트폰으로 모든 사람들이 한 대의 컴퓨터를 손에 들고 다니게 되고, 5G에 이르는 통신기술의 발달은 데이터의 축적을 획기적으로 확장시켰습니다.

아울러 인공지능에서 빼 놓을 수 없는 키워드는 실시간(real time)입니다. 이 역시 하드웨어와 소프트웨어의 발전 때문입니다. 더욱이나 최근 AI 칩의 초고속 발전으로 실시간의 개념이 확 바뀌었습니다. 디바이스에서 에지 학습(learning)이 가능하고 서브로 전달되는 지연시간 (latency)이 획기적으로 줄었습니다. 그야말로 실시간 즉 실제 상황과의 오차가 밀리세컨드의 범위로 줄어들었습니다.

그 결과 데이터 분석도 실시간으로 이뤄지기에 이르렀습니다. 더욱이나 인공지능의 핵심 역량인 예측 (prediction) 기능이 향상되고 그 속도도 빨라졌습니다. 예측은 확률(probability)입니다. 여기에서 점술이나 역술과 본질적인 다름이 생깁니다. 확률이란 “0”일 때는 예측 대상의 사건이 발생 가능성이 없다는 뜻이며 반대로 “1”일 때는 반드시 발생한다는 뜻입니다. 여기에서 확률은 “0”에서 “1” 사이의 수치로 표시됨을 알 수 있습니다. 반면 점술이나 역술은 “0” 또는 “1”로 표시됩니다. 만약 점쟁이가 예측하는 사건이 “어쩜” 일어날 수 있다던가, “아마도” 일어나지 않을 수 없다고 말한다면, 그 점집은 당장 폐업해야 할 것입니다.

확률이 “0”과 “1” 사이의 수치로 표현한다는 것만큼 애매한 예측도 없습니다. 통계학적인 경험치로 오차 범위를 표시하고 그 확률을 설명할 수밖에 없습니다. 여기에서 그래픽이 등장합니다. 그래픽이 시간을 단위로 사건의 확률을 표시하면 그 흐름을 알 수 있습니다. 또한 그래픽과 그래픽을 시간적으로 공간적으로 비교하면 그 흐름을 알고 예측의 확률을 높일 수 있습니다.

지금까지 IT업계에서 대시보드는 서비스 개념을 통상적으로 적용하여 무료로 제공하여 왔습니다. 데이터 분석을 단순히 그래프로 보여 주어서, 가시성을 높이는데 머문 것입니다. 그러나 인공지능의 대시보드는 데이터의 가시화 수준을 넘어 분석과 예측의 도구로 발전하기에 이르렀습니다. 특히 다양한 그래프의 사용은 데이터에 기반한 분석과 예측의 효율성을 높였을 뿐 아니라 데이터의 분석과 예측을 효과적으로 가시화(visualization)하였습니다.

방역은 근본적으로 데이터에 기반하여야 효과적입니다. 그리고 데이터에 기반하여 감염병을 분석하고 예측할 수 있어야 마땅합니다. 우선 다양하고 많은 양의 데이터를 수집해야 하겠지요. 검진자의 숫자, 확진자의 숫자, 위중증환자의 숫자, 그리고 사망자나 치유자, 가능하다면 후유증의 타입과 타입 별 숫자 등 방역을 위한 데이터가 무궁무진합니다. 더욱이나 커뮤니티간, 지역간, 국가간 사이의 데이터를 기반으로 비교하는 것도 필요합니다.

데이터의 중요성에 비추어 생각해 볼 때, 우리나라 방역은 지금까지 얼마만큼 데이터 수집에 노력하고 그 결과를 확보했을까요. 이 문제가 중요한 까닭은 ‘위드-코로나’(with Corona)의 시행으로, 지금까지 방역을 위한 여러 가지 ‘금지사항’을 해제시키기 때문입니다. 무엇보다도 집합금지와 같은 통제를 시민의 자율권에 맡기는 것입니다. 손씻기와 체온재기 그리고 마스크 착용은 계속될 것 같습니다. 손씻기를 제외하고 체온재기와 마스크쓰기와 같은 집단의 노력을 지속시키면서 개인의 일탈을 허용하지 않는다는 측면에서 통제에 속합니다. 따라서 통제가 아예 사라지는 것은 아닙니다.

관건은 집합금지의 해제입니다. 정부가 ‘점진적 일상회복’ 또는 ‘점진적 위드코로나’를 말하는 것을 보면 집합금지가 전면적으로 해제될 것 같지 않습니다. 단지 질병관리청 정은경 청장은 11월 9일을 그 시작일자로 설정하였기 때문에, 지금부터 1달 이후 시행될 것입니다. 이 전제는 70%이상의 국민이 백신접종을 완료했다는 조건에서 비롯되고, 실제로 11월 9일의 설정도 그 같은 백신접종률에서 근거합니다. 유감스럽게 다른 나라의 위드-코로나 정책과 달리, 우리 나라는 변이의 불확실성이나 계절적 변동은 아예 고려하지 않고 있습니다.

또한 확진자의 숫자나 깜깜이 전파의 심각성도 고려대상이 되지 않는 것 같습니다. 단지 사망자 수치가 독감 수준, 아니면 최소 의료시설이 감당할 수 있는 수준이면 충분하다는 입장입니다. 본질적으로, 독감과 코로나를 동일한 전파력과 동일한 파급효과(impact)로 보고 있는 것 같습니다. 그러나 독감과 코로나는 전파력에서 비교되지 않을 정도로 전파력이 속도나 크기에서 코로나는 독감에 비교할 수 없을 만큼 위험합니다. 각자도생의 오징어 게임과 같은 장면이 대한민국에서 발생할 가능성을 배제할 수 없습니다.

더욱이나 확진자가 늘어나면 자가 격리치료로 대신하겠다는 방침인데, 과연 전파나 위중증-사망의 증가로 발전하는 것을 막기에 충분한지 의문입니다. 막상 자가격리 환자를 어떻게 의료적으로 관리하고 비상시에는 어떻게 대응할지, 그리고 숫자가 폭증할 때는 어떻게 질병관리청과 지자제 및 행정안전부가 대응할지는 아직 공개된 바 없습니다.

가장 큰 문제는 데이터이며, K위드 즉 다른 나라와 달리 ‘점진적’인 일상회복이 데이터에 기반하고 데이터 분석과 예측에서 내려진 정책인가에 대한 의문이 제기되지 않을 수 없습니다. 한마디로, 전혀 그렇지 않는 것 같습니다. 우선 2020년 최초의 감염자가 발생했을 때, 우리는 오로지 대구의 상황만 모니터하고 대구의 데이터에 집중했습니다. 객관적으로 대구는 서울이나 인천 그리고 부산에 비해 코로나 침투의 가능성이 적고 단지 신천지집단이란 특수성 때문에 폭발적 확산이 이뤄졌던 지역입니다. 이미 중국에서 시작된 이래 세계 각국의 데이터가 수집된 상황에서, 최소한 서울이나 인천과 부산 광역시에 대한 데이터를 수집하고 대구와 비교하여야 마땅했던 것입니다. 그리하여 데이터에 기반하여 집단감염의 패턴을 사전에 알면, 전파력을 차단하는데 도움이 되었을 것은 분명합니다. 아쉽습니다.

또한 추적조사 즉 역학전수조사에서 감염자와 접촉 시간에 대한 데이터를 근거로 어떤 시간대에서 어떤 집합환경에서 전파가 이뤄지는지를 분석해야 마땅했습니다. 그러한 데이터가 존재한다는 이야기는 못 들었습니다. 만약 그러한 노력이 이뤄졌다면, 오후 6시를 기점으로 바이러스 전파력이 폭증하여 집합금지의 시점을 오후 6시로 설정한 것이냐는 자영업자들의 추궁에 대해, 정부가 설득력 있는 답변을 내 놓을 수도 있었을 것입니다.

더욱이나 그래픽 분석과 전망이라는 방법에 대해 무관심하거나 정부작성 데이터가 실시간으로 그래픽 분석과 전망으로 전환될 수 없는 등 근본적 기술문제도 있습니다. 공공에서 사용하는 문서들은 기업이나 해외에서 많이 쓰는 문서작성 프로그램과 달리, 통계적 처리를 위한 자동 테이블 작성 기능이 없거나 취약합니다. 데이터를 수집하고 정화(cleaning)하고 정상화(normalizing)하며 통합(integrating)을 자동화하는 이유는 속도와 효율 때문이며, 정화-정상화-통합 등 데이터의 정리(curation)가 실시간으로 진행되어, 그래픽으로 실시간으로 분석과 예측이 이뤄지도록 전환되어야 함에도, 우리의 현실은 그렇지 못하였습니다.

그래프 분석과 예측은 수학적인 네트워크에 기반합니다. 그 네트워크는 다시 노드(node)와 관계(relationship)로 구성하며 노드는 버텍스(vertex), 그리고 관계는 에지(edge) 또는 링크(link)라 불리 웁니다. 결국 노드와 관계로 구성된 그래프는 데이터 사이의 패턴을 표현하며, 전통적인 통계학적 방법론보다 분석이나 예측에서 월등하게 우월합니다.

메일랩은 방역이나 보안과 산재보호에서 그래픽 분석과 예측을 고객이 쉽게 수행하기 위한 대시보드를 개발하였습니다. 무엇보다도 방역을 위해 공장이나 빌딩 전체가 셧다운 되는 것을 막고 위해, 블록(block)이란 개념을 도입하여 부분 셧다운으로 전체적 운영에 지장을 초래하지 않는 구조를 개발하였습니다. 환기시스템과 동선에 기반하여 블록을 나누어 방역에 대처하는 것입니다. 구체적으로 양성의심자 한 사람의 출현으로 전체 빌딩이나 공장이 셧다운 되는 것을 방지합니다.

위드-코로나로 깜깜이 확진자들이, 즉 격리되지 못한 양성환자들이 활보하는 상황에서 각 커뮤니티는 메일랩의 QSS Integrated Solution을 통해 독자적으로 위드-코로나를 성공적으로 시행할 수 있습니다. 자신들의 회사, 학교, 아파트단지를 보호하는 수단이 바로 심부체온을 입구에서 측정하여 그러한 위험인물을 사전에 출입하지 못하도록 조처하는 것이며, 마스크 착용도 어김없이 이뤄지도록 관찰하고 경고하며, 실내에서의 거리두기도 관찰과 경고가 가능한 기술 외에도, 실시간 데이터의 시계열(time-series) 분석에 근거 집단감염의 확률을 예측하기 위해 손쉬운 그래프 분석과 예측이 가능한 대시보드를 메일랩은 제공하여, 커뮤니티의 위드-코로나가 성공할 수 있도록 노력하고 있습니다.

그런데 확진자 발생의 확률을 예측하기 위해, 얼마나 높이 그리고 얼마나 많이 심부체온(core temperature)가 상승하여야 되는지, 얼마나 많은 사람이 마스크를 착용하지 않았는지, 그리고 얼마나 많은 사람이 거리두기를 지키지 않아야 하는지 그 기준치가 의학적으로 아직 확정되지 않은 상황에서 그래픽 분석은 데이터에 기반한, 즉 에비던스(evidence)에 기반한 예측으로 충분히 효과적인 기능을 발휘할 수 있습니다. 쉽게 말해, 데이터패턴 사이의 비교를 그래프를 통해 이상현상(abnormality) 예측하는 것입니다. 물론 확률에 불과하지만 사전예방을 통한 방역수단으로 활용하기에는 충분합니다.

보안과 안전도 마찬가지입니다. 메일랩의 대시보드는 그래픽 분석과 예측으로 어느 지점이 보안에 취약하고 어느 지점에서 산업재해가 빈번하게 발생하는지를 파악하고, 그래프로 사용자인 고객이 쉽게 이해할 수 있도록 도와줍니다. 단순히 경험이나 숫자로만 분석하는 한계를 데이터 그래프로 극복할 수 있습니다. 단순한 무료제공의 서비스용 대시보드가 아니며, 메일랩의QSS(Quarantine 방역 – Security 보안 – Safety 안전)의 통합시스템은 설치 후에도 지속적인 서비스를 통해 그래픽 분석과 예측이 가능하도록 도와줍니다.

데이터를 수집하고 클린징하고 테이블 등의 방법으로 정리하며 통합시키는 것도 중요하지만, 실시간 내지 아예 장기간의 간격으로 트렌드(trend)를 찾는 것이 매우 중요합니다. 앞에서 지적한 바와 같이, 우리나라는 국가나 지방자치단체 차원의 코로나19의 대처에서 그 같은 데이터 활용이 아쉽게도 이뤄지지 못하였지만, 이제 다행스럽게도 각 커뮤니티 차원에서 메일랩과 같이 콜레버레이션하여, 개별 학교, 회사, 아파트단지가 데이터에 기반한 방역 그리고 위드-코로나를 효과적으로 실행할 수 있게 된 것입니다.

K방역의 위드-코로나를 위해 언론은 단순히 팩트 체크에 머물지 말고 대안적 목소리를 내야 한다고 생각합니다. 무엇보다도 빅데이터나 인공지능에 기반한 분석과 예측이 가능한 기술적 변화를 언론 스스로가 이해하며, 국민이 궁금하고 걱정하는 문제(problem)에 대해 해결(solution)은 제시하면 좋지만, 그렇지 못하더라도 최소한 해결에 대한 공론의 장(field)을 제공할 의무는 있다고 생각합니다.

참조:

지은이 양필승: 1957년생. 미국 UCLA 중국현대사 박사. 전 건국대학교 교수와 현 한국뉴욕주립대 석좌교수, 현 중국 칭화대학 겸임교수, 현 중국 지린 메트로폴리탄 기술교육대학 총장, 1999년CKT그룹 설립, 2018년 매경 세계지식포럼 AI부문 좌장, 2019년 MAILab 메일랩 설립 CEO.

MAILab (메일랩) www.mailab.co.kr: 자체 엔진인 i2Brian과 Vision AI Framework, MEGA Image AI Platform 및 MEGA Industrial AI Platform에 터잡아 QSS 통합 솔루션으로 방역, 보안 및 안전에 대한 인공지능 솔루션을 상품화하고, 미국, 캐나다, 중국, 인도에 엔지니어링과 마케팅 조직을 통해 QSS Integrated Solution 등 Industrial AI, 선천성 심장병 알고리즘 등 Medical AI, Robotic Intelligent Fulfillment Service 등 Logistic AI, 스킨케어와 메이크업 제품의 판매 및 생산을 위한 Beauty AI 등을 개발하고 있습니다.

문의 (류성렬): sryoo@ckt21.com

그래픽 데이터 분석과 예측은 “위드코로나” 성공의 키

Recent Posts