구글 로봇 AI, 현실세계로 진격

2026-06-01 13:00:01 게재

제미나이의 로봇 제어 확장

종이접기·도시락 싸기 수행

구글 딥마인드가 인공지능의 다음 격전지로 로봇을 지목했다. 글을 쓰고 이미지를 만드는 생성형 AI 경쟁을 넘어, AI가 실제 세계에서 사물을 보고 만지고 움직이는 체화 지능 경쟁으로 무게중심이 옮겨가고 있다는 것이다.

구글은 로봇이 사람의 말을 알아듣고 종이접기나 도시락 싸기처럼 섬세한 손동작이 필요한 작업까지 수행하는 기술을 개발 중이다.

캐롤리나 파라다 구글 딥마인드 로봇 부문 부사장은 29일(현지시간) 블룸버그TV와 인터뷰에서 AI가 실제 세계에서 사물을 보고 판단하고 움직이는 기술이 인공지능의 다음 전선이라고 말했다. AI가 언어와 이미지를 이해하는 데 그치지 않고, 로봇의 몸을 통해 실제 환경에서 행동하도록 하는 기술이다.

파라다 부사장은 이날 오전 도쿄 휴머노이드 서밋에서 ‘언어에서 동작으로, 제미나이가 차세대 로봇을 움직이는 법’라는 제목의 기조연설도 했다. 언어를 행동으로 바꾸는 기술이 차세대 로봇의 핵심이라는 점을 강조했다.

구글 딥마인드가 개발 중인 핵심 기술은 제미나이 로보틱스다. 구글의 AI 모델 제미나이를 로봇 제어 영역으로 확장한 기술이다. 사용자가 자연어로 명령하면 로봇이 주변 환경을 파악하고, 작업 순서를 나눠 실제 동작으로 옮기는 방식이다. 기존 산업용 로봇이 정해진 동작을 반복하는 데 강했다면, 제미나이 로보틱스는 낯선 환경에서도 명령을 이해하고 상황 변화에 맞춰 움직이는 범용 로봇을 목표로 한다.

파라다 부사장은 구글 딥마인드가 로봇의 정교한 작업 능력을 끌어올리는 데 주력하고 있다고 설명했다. 대표적인 예로 종이접기와 도시락 싸기 같은 작업을 들었다. 사람에게는 단순해 보이지만 로봇에는 어려운 일이다. 물체의 형태와 위치를 정확히 인식해야 하고, 손가락과 팔을 미세하게 조절해야 하며, 작업 순서도 스스로 판단해야 하기 때문이다.

지난 3월 구글 딥마인드가 공개한 제미나이 로보틱스 설명 자료에도 이 같은 방향이 담겨 있다. 핵심은 로봇이 사람의 지시를 이해하고, 시각 정보를 바탕으로 주변 상황을 판단한 뒤, 이를 실제 행동으로 옮기도록 하는 것이다. 예컨대 도시락을 싸라는 지시를 받으면 어떤 물건을 먼저 집고 어디에 놓을지, 상황이 바뀌면 어떻게 대응할지를 스스로 계산해야 한다. 구글 딥마인드는 언어와 시각, 행동 제어를 하나로 묶어 이 한계를 넘어서려 하고 있다.

상용화까지는 과제도 남아 있다. 사람 주변에서 움직이는 로봇인 만큼 안전성 검증이 필수이고, 정교한 손동작과 장시간 작업의 안정성도 더 높여야 한다. 고가의 하드웨어와 부족한 학습 데이터 역시 확산의 걸림돌이다. 그럼에도 오픈AI와 엔비디아, 테슬라 등 빅테크가 로봇과 물리 AI 투자를 확대하면서, AI 경쟁의 무게중심은 챗봇을 넘어 현실 세계에서 움직이는 로봇으로 옮겨가고 있다.

이주영 기자 123@naeil.com

이주영 기자 기사 더보기