LG '초거대 멀티모달 AI' 개발 나서

2022-04-26 11:04:34 게재

서울대·LG AI 연구소 현판식 … 8개 과제 공동연구

LG AI연구원은 25일 서울대 AI대학원과 공동으로 설립한 'SNU-LG AI 리서치 센터' 현판식을 열고 초거대 멀티모달 AI 공동 연구를 본격화한다고 26일 밝혔다.

멀티모달 AI는 이미지 글 음성 등 다양한 데이터를 이해할 수 있는 AI 모델을 말한다.
LG AI연구원과 서울대는 25일 서울대에서 SNU-LG AI 리서치 센터 현판식을 개최했다. 사진 LG 제공


SNU-LG AI 리서치 센터는 LG AI연구원과 서울대 AI대학원의 공동연구 거점으로 이경무 서울대대학원 협동과정 인공지능 전공 주임교수와 배경훈 LG AI연구원장이 공동 센터장을 맡는다.

리서치 센터는 AI가 가상공간에서 스스로 3차원의 신체를 생성하고 움직임을 구현할 수 있는 3차원(3D) 생성 기술 등 텍스트, 이미지와 같은 2차원 정보를 다루고 표현하는 기존 초거대 AI 한계를 뛰어 넘는 초거대 멀티모달 AI 핵심기술을 연구한다.

LG AI연구원과 서울대는 최근 초거대 멀티모달 AI핵심기술을 확보하기 위한 8개 공동연구 과제를 선정했다.

대표적으로 이경무 주임교수는 LG AI연구원과 함께 한 장의 이미지나 짧은 길이의 영상만으로도 특정 인물의 전신 형상과 움직임을 만들 수 있는 3차원 생성 기술을 연구한다. 이 기술은 AI휴먼에 접목했을 때 강력한 시너지를 낼 수 있다.

예를 들어 LG가 2월 뉴욕 패션 위크에서 선보인 AI 아티스트 '틸다'에 해당 기술을 접목하면 메타버스 내에서 자유롭게 활동하는 틸다의 모습을 3D로 구현할 수 있다.

또 다른 공동연구 주제로는 인간의 언어학습 구조를 모사한 차세대 언어모델이 있다.

언어 분야는 이미 뛰어난 성능을 보이는 모델들이 다수 있지만, 아직 상황이나 상식에 맞지 않는 답변을 내놓는 경우가 많다.

LG AI연구원과 서울대는 이 같은 한계를 극복하기 위해 기존에 학습된 정보뿐 아니라 외부의 정보를 스스로 학습한 뒤 종합적으로 판단하는 인간의 언어학습 구조를 닮은 AI를 개발할 예정이다.

양측은 또 기존 언어나 이미지 형식의 정보뿐 아니라 도표와 그래프, 시각과 청각 정보가 함께 담긴 동영상, 온도와 같은 촉각기반 정보 등 다양한 형태의 정보를 인간처럼 동시에 학습하고 활용할 수 있는 멀티모달 AI도 연구한다.

이들 과제는 아직 전 세계적으로 연구 초기 단계로 글로벌 초거대 멀티모달 AI 주도권을 잡기 위해서는 꼭 선점해야 하는 분야이다.

한편 LG AI연구원은 3년간 1200억원 이상을 투자해 개발하고 있는 국내 최고 성능의 초거대 AI '엑사원'(EXAONE)을 지난해 12월 공개했다.

2월에는구글 우리은행 EBS등 국내외대표 기업 12개사와 손잡고 이종산업 간 첫 민간 초거대 AI 연합체인'엑스퍼트 AI 얼라이언스'를 발족하며 글로벌 초거대 AI 기술 주도권 선점에 나섰다.

고성수 기자 ssgo@naeil.com
고성수 기자 기사 더보기