top of page
Search
  • Writer's pictureMAILab2021

메타버스, 딥러닝 인공지능의 완성체

2022.4.18 양필승



페이스북(메타)의 메타버스 비디오


28. 메타버스, 딥러닝 인공지능의 완성체

29. 코딩 없는 인공지능 개발.

30. 산업안전, 법만으로 해결 못한다. 역시 안전AI!

31. 보다 예쁘고 건강하게 만드는 인공지능



아마도 우리나라에서 현재 가장 유행하는 기술관련 단어는 ‘메타버스’일 것입니다. 원래 ‘메타’ (meta)란 가상, 초월을 의미하며 버스는 세계, 우주를 의미하는 '유니버스'(universe)에서 따와 합성한 신조어입니다. 메타버스란 조어는 닐 스티븐슨(Neal Stephenson: 1959 ~ )의 1992년작 소설 《스노우 크래쉬》(Snow Crash)에서 처음 등장합니다. “컴퓨터가 만들어내서” 고글(goggles) 과 이어폰을 통해 계속 공급해주는 “가상의 세계”라고 정의하며 “메타버스”란 용어와 개념을 등장시킵니다.

메타버스에 대한 기술적 이해는 다양하면서도 이제는 점차 정리되고 있습니다. 그 선두에는 회사이름까지 바꾼 페이스북이라 봅니다. 이제 페이스북은 스스로를 ‘메타’라고 부르면 메타버스의 기술을 선도하고자 노력하고 있습니다. 그래서 이 글에서는 ‘메타’가 정의하는 메타버스를 이해하는 것을 바탕으로 인공지능, AI와의 관계를 설명하려고 시도합니다. 특히 메일랩이 현재 개발중인 뷰티관련 ‘AI-powered 메타버스 플랫폼’도 잠시 소개하며 실제로의 경험을 공유하고 싶습니다.

메타버스에 대해 ‘메타’의 창업자인 주크버크는 키워드로 “connect”를 꼽으며 자신이 창업한 ‘페이스북’이란 소샬미디어와의 연속 선상에서 설명합니다. 즉 메타버스는 ‘사회적 연계망’(social connection)이며, 다양한 기능을 수행한다는 주장입니다. 구체적으로, 엔터테인먼트, 게임, 체련, 교육, 상업 등 다양한 기능을 소프트웨어와 하드웨어를 결합하며, 5G와 같은 고속의 인프라를 기반한다는 것입니다. 구체적 기술적 요소로서, 가상현실(virtual reality), 확장현실(augmented reality), 그리고 스마트 글래스 (smart glass) 등을 꼽고 있습니다.

메일랩이 주목한 것은 어떻게 인공지능과 메타버스가 결합하는 가였습니다. 특히 메일랩이 자체 엔진(i2Brain)을 확보한 비젼AI와 메타버스가 어떻게 결합하는가에 주목하였습니다. 무엇보다도 가상현실이나 확장현실 모두 비젼AI가 실현할 수 있는 영역이었기 때문이며 향후 메타버스의 발전 방향이 종국에는 비전AI를 포함하는 딥러닝(deep learning) 기술의 완성체라고 판단하였기 때문입니다.

메타버스가 추구하는 ‘기계-스토리텔링’(machine storytelling)은 테슬러 창업자 엘런 머스크 등이 투자한 기업인 Open-AI-Lab이 개발한 Generative Pre-trained Transformer (GPT) 시리즈 엔진을 개발하여, 자연언어(natural language) AI에 기반한 트랜스포머를 통해 스토리를 창조하고 다시 디자이너가 원하는 바를 서술하고 이 중 가장 좋은 ‘아이디어’를 선택한 이후 원래 디자이너가 원했던 ‘체험’을 편집하는 것입니다. 이때도 인공지능이 사용되는 것은 물론입니다.

그런데 메타버스가 각광받는 부분은 단순히 텍스트를 편집하고 창출하는 트랜스포머의 차원을 넘어서, 텍스트에 적절한 이미지를 편집하고 창출하는 능력입니다. 이 같이 이미지와 텍스트를 결합하면 텍스트를 보다 잘 이해할 수 있습니다. 왜냐하면 현실세계에서 우리가 보는 이미지로 인해 우리의 텍스트에 대한 이해력이 향상되기 때문입니다.

이 같은 설명은 그 동안 우리가 인터넷을 발전시켜온 역사를 이해하면 쉽게 받아 들일 수 있습니다. 처음에 WWW 웹이 출현하였을 때 서로 간의 관계는 단선적이었던 반면 다음세대의 웹에서는 서로 사이의 관계가 다이나믹해졌으며, 구체적으로 처음에는 단순한 문자교환이나 음성교환으로 출발하여 텍스트와 이미지 및 비디오가 결합되기에 이르렀던 것입니다. 이제 메타버스를 통해 우리는 Web3의 단계로 진입하게 됩니다.

Web3란 초대형의 스케일로 지속적이고 상호작용적이며 실시간으로 연결되어 운영되는 플렛폼이며, 이 안에서 인간이 사교하고, 일하고, 거래하며, 놀고 창조하는 가상공간이 작동합니다. 이러한 가상공간의 시대인 Web3는Web2 (2000년 이후 현재까지)보다 분산적이어서, 창조와 사용자 사이에 민주적인 관계가 형성되고 공룡기술기업에 의해 지배되지 않을 수 있습니다. 물론 메타로 이름을 바꾼 페이스북도 web2시대의 공룡기술기업에 속합니다만, 미래의 web3에는 메타란 기업도 사라질 수 있는 가능성이 있습니다.

이러한 인터넷 공간이 작동하기 위해서는 거대한 컴퓨터 능력이 필요하고 더 빠른 통신망이 필요하며 데이터의 분산화를 위한 블록체인 기술이 동원됩니다. 이미 G5시대에 돌입한 우리나라에게는 유리하며, 메타로 개명한 페이스북은 어마어마한 속도의 슈퍼컴퓨터를 보유하고자 노력하고 있습니다. 메타의 슈퍼컴퓨터는 무려 1,895 petaflops로, petaflop이 1초당 1경(京) 즉10의 16제곱 (1조의 1만배)이기 때문에 1초당1,895경 즉 1,895만(萬) 조(兆)의 데이터가 처리됩니다.

비전 AI기업인 메일랩에게 특히 흥미 있던 부분은 ’First-person view’(FPV) 또는 ‘Egocentric Live 4D Perception’(Ego4D)이란 개념과 기술입니다. ‘First-person point of view’(POV)이라고도 부르는데, 자신의 실제 위치가 아닌 초월적인 특정 지점에서 시각적으로 인식하는 기술적 능력으로, 예를 들어, 비디오 게임에서 캐릭터나 드론 텔레메디슨의 환자가 자신이 속한 환경의 관점에서 인식하는 것입니다. 이제까지 제3자적인 관점(third-person view)에서 사물을 인식하였다면, 당사자의 관점(first-person view)에서 사물을 인식하는 방식인 셈입니다. 예를 들어, 사진이나 비디오를 찍을 때, 우리는 제3자적인 관점에서 촬영하는데 익숙한 반면, 머리 위에 위치한 카메라로 당사자 자신의 관점에서 촬영하기 시작한 것은 최근입니다.

특히 비디오 게임을 통해 설명하면, 당사자 관점의 사물 인식이 쉽게 이해됩니다. 게임 플레이어(사용자)는 캐릭터의 시각, 즉 당사자의 시각에서 게임을 인식하며, 캐릭터 주변을 아주 가깝게(zoom-in) 관찰하여 자신 앞의 광경(scenery)을 보다 선명하게 시각적으로 인지할 수 있습니다. 결국 당사자의 시각은 사용자에게 몰입적 (immersive) 체험을 제공할 수 있습니다.

지금까지 인터넷상의 사진을 통해 사물을 감지(detecting)하거나 라벨링(labelling)하는 것에 머물렀다면, 당사자 관점의 인식(first-person or “egocentric” perception)은 당사자의 웨어러블이나 머리위에 장착된 디바이스로 이미지, 비디오, 오디오 및 모션 등 다양한 동적인 감각적 데이터 (sensory data)를 스트리밍(streaming)되며, 동시에 이들 멀티모달 데이터 (multimodal data)가 물리적 환경이나 사회적 맥락 및 인간과 사물 사이의 상호작용에 대한 3D적인 이해를 통해 통합(integration)되는 것입니다.

메일랩에게 또다른 흥미거리는 딥러닝의 완성체라는 메타버스의 방향성입니다. 딥러닝은 뇌과학적인 원리에 따라 우리가 듣고, 보고, 말하는 인지작용을 컴퓨터를 통해 기계적으로 수행하는 인공지능 기술로서 2012년부터 본격적으로 발전하기 시작하였습니다. 듣는 인공지능이 voice AI, 보는 인공지능이 vision AI, 그리고 말하는 인공지능이 NLP입니다. 이 같은 딥러닝 인공지능의 감각적이고 복합적인 인지작용이 메타버스를 통해 서로 상호작용하기에 이른 것입니다.

쉽게 이야기하면, 듣고 말하며, 보고 말하고, 들으며 보고, 마침내 동시적으로 듣고, 보고, 말하는 것이 컴퓨터를 통해, 즉 기계를 통해 실시간으로 진행되는 것이 메타버스의 방향입니다. 즉 딥러닝의 개별적인 기능이 통합적으로 상호작용하는 방향으로 메타버스를 발전할 것으로 보입니다. 그리하여 인간의 보고, 듣고, 말하는 작용을 통해 이성적이며 예술적인 기능을 수행하는 것처럼, 메타버스도 이성적이며 예술적인 기능을 통해 인간과 인간 사이의 소통을 추구하며, 이는 결코 현실적이고 물리적인 세계가 아니라 초월적이고 가상적인 공간에서 이뤄집니다.

결국 메타버스의 발전은 인공지능 특히 딥러닝 인공지능의 발전에 기반을 둘 수밖에 없습니다. 지난 10년간 딥러닝이 비약적으로 발전한 배경에는 금융자본주의를 통한 거대한 자금 동원이나 컴퓨팅 파워와 같은 하드웨어 능력의 향상 그리고 소프트웨어 파워를 비약적으로 업그레이드시키는 인재양성이 결합되어야 할 뿐 아니라, 빅데이터 그야말로 어마어마한 양과 그야말로 다양한 형태의 데이터가 제공되어 가능합니다. 한마디로, 메타버스는 인공지능의, 딥러닝의 연장 선상에 위치하고 있습니다.

메타버스는 결코 유행어가 아닙니다. 구체적이며 실체적인 기술이며, 문명을 바꾸는 인공지능 기술의 일부입니다. 갑자기 메타버스란 기술을 모방적으로 개발하는 것보다 그래서 보다 큰 스케일이며 보다 거시적인 인공지능의 기술, 특히 인공지능의 하드웨어와 소프트웨어의 기반에서 가능하다는 사실을 깨닫도록 언론이 열심히 분석하고 설명하여야 마땅합니다. 그냥 정치가와 관료에게 맡겨두고 방치할 주제는 아니기 때문에, 언론의 역할이 중요합니다.


 

지은이 양필승: 1957년생.미국UCLA중국현대사 박사.전 건국대학교 교수와 현 한국뉴욕주립대 석좌교수,현 중국 칭화대학 겸임교수,현 중국 지린 메트로폴리탄 기술교육대학 총장, 1999년CKT그룹 설립, 2018년 매경 세계지식포럼AI부문 좌장, 2019년MAILab메일랩 설립CEO.


MAILab (메일랩)www.mailab.co.kr:자체 엔진인i2Brain과Vision AI Framework, MEGA Image AI Platform및MEGA Industrial AI Platform에 터잡아QSS통합 솔루션으로 방역,보안 및 안전에 대한 인공지능 솔루션을 상품화하고,미국,캐나다,중국,인도에 엔지니어링과 마케팅 조직을 통해QSS Integrated Solution등Industrial AI,선천성 심장병 알고리즘 등Medical AI, Robotic Intelligent Fulfilment Service등Logistic AI,스킨케어와 메이크업 제품의 판매 및 생산을 위한Beauty AI등을 개발하고 있습니다.

16 views
bottom of page