신문로
체화된 인지와 ‘물리적 AI(Physical AI)’
젠슨 황 엔비디아 CEO는 올해 초 열린 CES 2025 기조연설에서 생성 및 추론형 AI 다음에 등장할 AI 물결은 바로 ‘물리적 AI(Physical AI)’라고 선언했다. 이는 우리가 뉴스에서 보는 휴머노이드 로봇과 자율주행차 등을 구동하는 기술로, 단지 ‘생각’만 하는 것이 아니라 물리적 세계에서 실제로 행동하는 기계를 포괄하는 개념이다.
이 최첨단 기술은 개념적으로 완전히 새로운 것이 아니다. 1980년대 MIT의 로드니 브룩스(Rodney Brooks) 교수는 복잡한 기호와 규칙만으로 세상을 이해하려는 ‘추상적 지능’에 반기를 들며 “지능은 몸을 통해 현실세계와 직접 부딪히며 발현된다”고 주장했다. 이는 ‘체화된 인지(embodied cognition)’라는 과학철학 이론의 토대가 됐다.
이 이론이 실제 구현되기 위해서는 수십년에 걸쳐 발전해온 로봇공학과 컴퓨터 비전, 그리고 강화학습 기술이 필요했다. 결정적으로는 최근 급속하게 발전한 거대언어모델이 이들을 하나의 시스템으로 통합시켰다. 이런 시대의 흐름 속에 등장한 물리적 AI는 체화된 인지 이론의 최첨단 기술적 구현이다.
인지-추론-행동을 AI로 구현하는 기술
체화된 인지 이론에 따르면 지능은 뇌가 실행하는 별개의 프로그램이 아니라 물리적 신체, 감각-운동 활동, 그리고 환경 사이의 복잡하고 실시간적인 상호작용으로부터 발현된다. 예를 들어 바위 위를 탐색하는 개미를 생각해보자. 개미는 복잡한 내부 지도나 강력한 연산이 가능한 두뇌를 가지고 있지 않다. 그보다는 ‘왼쪽 더듬이가 무언가에 닿으면 오른쪽으로 돌아라’처럼 수억년에 걸쳐 진화한 매우 단순한 규칙에 따라 움직인다.
이 단순한 규칙이 여섯개의 다리와 바위라는 물리적 제약과 결합해 고도로 지능적인 것처럼 보이는 운행의 궤적을 만들어낸다. 우리가 보는 개미의 ‘영리함’은 그의 머릿속에 저장된 것이 아니라, 개미-환경 시스템이 함께 작동하는 속성인 셈이다. ‘영리한’ 부분은 생각이 아니라 바로 그 물리적 상호작용 자체다.
오늘날의 물리적 AI는 이와 똑같은 원칙 위에서 강력한 최신 기술로 구현된다. 조선소의 용접로봇, 자동차공장의 조립로봇, 혹은 자율주행차가 그렇다. 이 ‘인지-추론-행동’의 순환은 모든 체화된 에이전트의 기본적인 심장박동과 같다. 즉, 센서(카메라, 라이다)로 세상을 ‘인지’하고 AI 모델로 ‘추론’하며, 모터와 바퀴로 세상 속에서 ‘행동’한다.
결정적인 차이점은 이 '규칙'이 생성되는 방식에 있다. 규칙이 진화에 의해 DNA에 새겨진 개미와 달리 현대의 AI는 딥러닝 과정의 시행착오를 통해 스스로의 복잡한 규칙을 발견한다. 강화학습이라고 알려진 이 과정이야말로 AI가 스스로 체화된 기술을 개발하게 하는 엔진이며, 추상적인 이론을 실질적인 현실로 바꾸는 힘이다.
우리는 로봇들이 훈련받는 방식에서 이를 가장 명확하게 볼 수 있다. 휴머노이드 로봇은 ‘걷기 위한 규칙’을 명시적으로 프로그래밍 받지 않는다. 대신 로봇의 완벽한 가상 복제본인 ‘디지털 트윈’이 물리 시뮬레이션 환경에 놓여, 안전하게 실패하고 가속화된 속도로 학습할 수 있게 된다.
AI에게는 “앞으로 나아가라”와 같은 단순한 목표가 주어지고, 로봇의 팔 다리 관절을 움직이는 규칙은 거대한 인공신경망으로 표현된다. 이 인공신경망의 파라미터들을 학습하기 위해, 생성형 AI는 실험을 시작한다. 엄청난 수의 파라미터들을 수백만번 이상 조정하며, 실제 로봇이었다면 파괴되었을 가상환경에서 넘어지고 또 넘어진다. 실패할 때마다 AI 모델은 스스로의 연결망을 조정하며 균형 마찰 운동량과 같은 복잡하고 직관적인 물리학을 서서히 ‘발견’해 나간다. 자연선택이 아니라 시뮬레이션선택으로 걷는 법을 배우는 것이다.
더 빠른 칩보다 실패할 자유가 필요
물리적 AI는 체화된 인지 이론의 궁극적인 입증이다. 단순한 개미에서 복잡한 로봇에 이르기까지 교훈은 동일하다. 지능은 순수하게 추상적일 수 없다. 지능은 반드시 물리적 세계에 기반을 두어야 하며, 자기 행동의 결과로부터 배워야 한다. 이러한 기계들이 더 보편화됨에 따라 미래의 AI는 단지 우리가 화면을 통해 대화하는 대상이 아니라 우리와 물리적 공간을 공유하는 존재가 될 것임이 분명하다.
오늘날의 물리적 AI는 진정으로 ‘똑똑한’ 기계를 만들기 위해 단지 더 빠른 컴퓨터 칩이나 더 복잡한 거대언어모델을 만드는데 그치는 것이 아니라 기계에게 학습할 수 있는 신체와 (시뮬레이션 된) 우리 세계에서 실패할 자유를 주어야 함을 보여준다.
인간이 생성한 인터넷 상의 데이터는 오래전에 모두 언어모델들의 학습 데이터로 소진되었다. 하지만 자연이라는 놀이터는 아직 AI에게 무궁무진한 학습의 기회를 제공한다. 이마저도 AI가 모두 섭렵하면 그 이후에는 무엇을 가르쳐야 할까?