구글, 제미나이 3.5 기반 동시통역 모델 공개

2026-06-10 13:00:01 게재

70여개 언어 동시에 처리

구글이 최신 인공지능(AI) 모델인 제미나이 3.5를 기반으로 한 차세대 번역 모델을 공개하며 실시간 통역 경쟁에 뛰어들었다. 단순 번역을 넘어 화자의 억양과 말투까지 재현하고 70여개 언어를 동시에 처리할 수 있다는 설명이다.

구글은 9일(현지시간) 새로운 번역 모델인 ‘제미나이 3.5 라이브 트랜슬레이트(Gemini 3.5 Live Translate)’를 자사 번역 서비스에 전면 도입한다고 발표했다.

가장 큰 특징은 기존의 순차 통역 방식에서 벗어나 사실상 동시통역에 가까운 ‘연속 실시간 생성’ 기술을 구현했다는 점이다. 기존 AI 번역 서비스는 사용자가 문장을 끝까지 말한 뒤 번역 결과를 제공하는 경우가 많았지만 새 모델은 발화가 진행되는 동안 문맥을 분석하며 번역을 생성한다. 서로 다른 언어를 사용하는 이용자들도 자연스러운 대화 흐름을 유지할 수 있게 됐다는 의미다.

언어 선택 과정도 크게 간소화됐다. 기존에는 사용자가 번역할 언어를 미리 지정해야 했지만 새 모델은 대화 내용을 분석해 언어를 자동으로 식별한다. 영어, 한국어, 일본어 등이 혼재된 다국어 환경에서도 별도 설정 없이 번역이 가능하다.

음성 합성 품질 역시 대폭 향상됐다. 번역 결과를 단순 기계음으로 전달하는 수준을 넘어 화자의 억양, 속도, 음높이, 감정 표현 등을 최대한 유지해 상대방에게 전달한다.

사용 방식도 개선됐다. 지금까지는 스마트폰에서 음성 통역 기능을 사용하려면 이어폰 연결이 사실상 필수였지만 새 서비스는 이어폰 없이 스마트폰을 귀에 대는 것만으로도 번역 음성을 들을 수 있다. 전화 통화와 유사한 사용자 경험을 제공하는 셈이다.

구글은 향후 화상회의 플랫폼인 구글 미트에도 해당 기술을 적용할 계획이라고 밝혀 글로벌 기업들의 다국어 회의와 국제 협업 환경이 크게 개선될 것으로 예상된다.

정재철 기자 jcjung@naeil.com

정재철 기자 기사 더보기