[정보/트렌드] 2022년 주요 AI기술 (1) - 다중감각 AI란?

2022.02.02 18:36 2,699 조회
안녕하세요 !🤗 데이크루 1기 입니다!
  • 2022년이 된지도 벌써 한달이 지났습니다 ! 설연휴는 잘 보내셨나요?
  • 2021년 말에 한국전자통신연구원(ETRI)에서 2022년 10대 기술 전망’ 보고서를 발간하였습니다.
  • 10대 기술은 ETRI 연구진의 분석과 국내·외 기술동향 보고서를 바탕으로 선정되었다고 합니다.


-------------------------------------------------------



  • ETRI가 선정한 10대 기술 중 떠오르는 AI 분야는 다중감각 AI, 소프트웨어 2.0, AI 밀리테크였습니다.
  • 이중, 오늘은 다중감각 AI에 대해 소개하도록 하겠습니다!

출처: [기술정책 인사이트] ETRI가 바라본 2022년 10대 기술 전망


✔️1. ETRI가 다중감각 AI에 주목한 이유

1-1 . 초대형 AI에 거는 기대와 한계

  • GPT-3 등장 이후, 초대형 언어 모델은 언어뿐만 아니라 코딩, 작곡 등 인간의 모든 디지털 상호작용을 담당할 수 있는 핵심기술로 부상했습니다.
  • 구글의 '스위치 트랜스포머', 중국의 '우다오' 등 초대형 AI 기술경쟁이 치열해졌고, 구글의 '람다(LaMDA)', 화웨이의 '판구 알파(PanGu Alpha)' 등 초대형 언어모델이 중요한 비지니스 전략으로 사용되고 있습니다.
  • 그러나, 현재의 초대형 언어 모델은 불확실한 과학적 기반위에서 인터넷에 떠도는 방대한 텍스트 데이터에 지나치게 의존하고 있고, 낯선 환경에서는 제대로 작동하지 못하는 한계를 보입니다.


1-2. 감각 지능의 확장

  • 감각 지능의 확장이란, 지금의 인공지능이 인간과 비슷한 유연성을 가지기 위해서는 여러 개의 감각 지능을 결합하여 지능을 확장해야 하며, 이러한 '다중감각 AI' 방식이 범용 인공지능의 출현을 앞당길 수 있다는 주장입니다.
  • 주목할 점은 감각의 확장이 기존 시각, 청각, 언어지능 등 복수의 지능을 단순 결합하기 보다 세상을 인지하고(input), 그것을 표현하는(output) 서로 다른 지능 간의 연결을 통해 다중감각을 구현한다는 것입니다.
  • 즉, 어린아이들이 세상을 '보고', 그것에 대하여 '말함'으로써 성장하듯이, 인간이 감각 기관과 이와 관련된 언어 체계를 복합적으로 사용하여 세상을 인지하는 것과 마찬가지로 단일 지능의 AI에 인식하고 표현하는 감각 지능을 결합하면 사람과 같은 유연한 능력을 만들 수도 있다는 논리입니다.


✔️2. 주요 트랜드

2-1. 언어 시각 트랜스포머

  • 다중감각 AI에 관하여 가장 직관적이고 의미있는 결과를 보이는 분야에는 시각과 언어지능을 결합언어 시각 트랜스포머 연구가 대표적입니다.
  • 관련 연구로는 주어진 텍스트를 표현하는 이미지 생성, 시각 이미지로부터 텍스트 생성, 주어진 시각 이미지와 관련된 텍스트의 질문에 답을 하는 것 등이 있으며 Open AI의 이미지 사전학습 모델 ImageGPT, 이미지와 언어를 결합CLIP, 텍스트로 부터 이미지를 생성하는 DALL-E 등이 대표적입니다.
  • 중국에서도 유사한 WenLan, M6를 진행하는 등 중국어에 기반한 언어시각모델연구도 활발히 진행되고 있습니다.

출처: [기술정책 인사이트] ETRI가 바라본 2022년 10대 기술 전망


2-2 멀티모달 머신러닝

  • 다중감각 AI는 언어와 시각 지능을 단순히 결합하는 수준을 넘어, 질감을 느끼고 냄새를 맡고, 맛을 보는멀티모달 정보를 통합해 학습하는 멀티모달 머신러닝(MMML: Multimodal Machine Learning)으로 발전하였습니다.
  • MMML은 인간처럼 단일 감각이 아닌 다중감각(시각, 청각, 후각, 촉각, 미각 등)을 통합하여 상황을 이해하고 예측하는 인지,표현 기술로 멀티모달정보에는 상호보완적인 정보가 있을 수 있어 단일 감각 정보로는 드러나지 않는 패턴으로 훨씬 정확한 예측이 가능합니다.
  • 인간이 원활한 의사소통을 위해 언어적, 비언어적, 준언어적 정보를 함께 사용하듯이, 인공지능과 인간의 자연스러운 소통을 위해서는 멀티모달 정보의 통합적 이해가 필수적입니다.
  • 세계적 AI기업들과 선도국들은 이미 MMML 연구를 활발히 진행하고 있으며, 이를 의료, 자동차 산업 등에 적용중입니다.


✔️3. 의미와 전망

3-1 세상 밖으로 나온 인공지능

  • 서로 다른 감각 지능을 연결하여 인간과 유사한 유연성을 가진 다중감각 AI는 쓰고, 그리고, 말하고, 움직이는 작업과 산업분야(교육, 방송, 패션, 의료, 자동차 등)에서 혁신적인 제품과 서비스에 핵심 기능으로 내재화 될 수 있습니다.
  • 영상을 창작하거나 창의성이 요구되는 분야에서 새로운 아이디어를 제안하고, 나아가 종합적인 사고가 요구되는 투자 분야, 국방 분야 등에서 직접 의사결정을 수행하는 역할까지 확장할 수 있습니다.
  • 다중감각 인공지능은 유연성을 높일 뿐만 아니라 지금보다 더 안전하고 신뢰성 있는 인공지능을 구현하는 것에도 의미있는 역할을 하며, 범용 인공지능을 추구하는 다양한 연구들과 통합 발전할 것으로 기대됩니다.


3-2 범용 인공지능을 향한 또 다른 시도

  • 최근에 강화학습에 기반을 두고 거의 모든 인지 작업에서 인간을 능가하는 범용 인공지능을 만드려는 시도가 활발하게 진행중입니다.
  • 대표적으로 딥마인드는 거대한 가상의 놀이터 '엑스랜드(XLand)'를 만들어 강화학습 방식으로 AI 성능을 높이는 실험을 진행하고 있고, 우버 또한 가상 봇(Virtual Bot)의 훈련장 'POET'을 만들어 개방형 학습을 진행하고 있습니다.
  • 힌튼은 사람들이 세상을 파악하는 데 사용하는 직관적 방식을 모델링 하고자 GLOM이라는 새로운 아이디어를 제안하기도 했습니다. 다만 GLOM은 아직은 구체화되지 않은 아이디어 수준이며 주요 난제들이 남아있는 상태라고 합니다.



-------------------------------------------------------



  • 오늘은  2022년 주요 AI기술 중 다중감각 AI에 대하여 알아보았습니다!
  • 읽어주셔서 감사합니다 ! 🤗


   *본 포스팅은 데이콘 서포터즈 “데이크루" 1기 활동의 일환입니다. ✔️


출처
[기술정책 인사이트] ETRI가 바라본 2022년 10대 기술 전망 - https://library.etri.re.kr/service/main/index.htm


로그인이 필요합니다
0 / 1000
백남진
2022.02.03 08:47

다중감각이 감각을 통합하여 인지하고 예측을 하는군요! 신기합니다!

월드파파
2022.02.03 11:47

인공지능이 결합과 확장되면서 발전이 날로 갈수록 어마어마해지는군요 ,, 다중감각 AI 잘 읽었습니다 !