피터 틸도 꽂힌 AI 반도체 스타트업
영국 프랙타일, 3300억원 투자 유치
추론 반도체 'AI 답변 속도' 경쟁 가열
피터 틸이 투자한 벤처캐피털이 영국 인공지능(AI) 반도체 스타트업에 베팅했다. AI 개발 경쟁이 모델 크기에서 실제 답변 속도와 비용 경쟁으로 옮겨가고 있다는 신호다.
월스트리트저널(WSJ) 13일(현지시간) 보도에 따르면 영국 반도체 스타트업 프랙타일은 2억2000만달러 규모의 시리즈B 투자를 유치했다. 이번 투자는 투자회사 팩토리얼펀즈, 벤처캐피털 액셀, 피터 틸의 파운더스펀드가 주도했다. 시리즈B 투자는 스타트업이 초기 사업성을 검증한 뒤 제품 개발과 시장 확대를 위해 받는 후속 투자다.
프랙타일은 2022년 옥스퍼드대 출신 엔지니어 월터 굿윈이 세운 회사다. 이 회사는 AI 모델이 사용자 질문에 답을 내놓는 과정인 ‘추론’에 특화한 반도체를 만든다. AI가 글을 쓰고, 코드를 짜고, 복잡한 문제를 푸는 과정에서 실제로 중요한 것은 단순히 똑똑한 모델만이 아니다. 사용자가 질문한 뒤 얼마나 빨리, 얼마나 싸게 답을 내놓느냐가 서비스 경쟁력으로 떠오르고 있다.
굿윈은 WSJ에 현재 최첨단 AI 모델이 맞닥뜨린 핵심 제약은 “질문에 유용한 답을 내놓는 데 걸리는 시간”이라고 설명했다. AI 모델이 커지고 복잡해지면서 어려운 작업을 처리하려면 수천만개의 ‘토큰’이 필요하다는 것이다.
토큰은 AI가 문장과 데이터를 쪼개 처리하는 기본 단위다. 이 데이터가 프로세서와 메모리칩 사이를 얼마나 빠르게 오가느냐가 AI 답변의 지연 시간, 즉 반응 속도를 좌우한다.
프랙타일은 이를 해결하기 위해 서버 랙 안에서 메모리를 붙이는 방식과 논리칩 구조를 새로 설계했다고 밝혔다. 회사 측은 이를 통해 AI 기업이 속도를 희생하지 않고 데이터 이동 폭을 키울 수 있다고 설명했다. 굿윈은 “우리가 가고 싶은 곳은 빠르고 싸게 하는 것”이라고 말했다.
다만 프랙타일은 제품의 구체적인 기술 사양은 공개하지 않았다. 회사는 다만 AI 반도체에서 널리 쓰이는 고대역폭메모리(HBM)나 칩 내부의 정적램(SRAM)에 의존하지 않는다고 밝혔다. 이는 엔비디아 중심의 기존 AI 반도체 생태계와 다른 방식으로 추론 병목을 풀겠다는 뜻으로 풀이된다.
AI 반도체 시장에서는 이미 추론 수요를 겨냥한 경쟁이 본격화하고 있다. WSJ에 따르면 거대한 원판형 AI 칩으로 빠른 추론을 내세운 세레브라스는 14일 기업공개(IPO)를 앞두고 있으며 최대 48억달러 조달을 목표로 하고 있다. 벤처 투자자들로부터 1억달러를 유치한 메제스틱랩스도 최대 10조개 매개변수로 학습된 모델을 처리할 수 있는 메모리 용량을 제공한다고 주장하는 새 서버 제품을 최근 발표했다.
대형 기업들도 같은 방향으로 움직이고 있다. 반도체 기업 엔비디아와 클라우드 서비스 기업 아마존웹서비스(AWS), 구글클라우드 등은 추론 전용 프로세서를 내놓고 있다. AI 시장의 무게중심이 학습용 그래픽처리장치(GPU) 확보전에서 실제 서비스를 빠르고 저렴하게 돌리는 추론 반도체 경쟁으로 넓어지고 있는 셈이다.
양현승 기자 hsyang@naeil.com