엔비디아는 허점 찾고 중국기업은 틈새 노려

2023-12-13 11:01:06 게재

미정부 대중 기술통제에 엔비디아 계속 우회로 모색 … 중국은 자체 공급망 구축 기회로

미국 상무부 산업안보국이 첨단기술 수출을 규제하기 위해 최근 도입한 규제는 미중관계의 이정표일 뿐만 아니라 세계 과학기술의 현주소를 보여주는 분수령이기도 하다.

올해 10월 16일 발표된 미국의 첨단 컴퓨팅·슈퍼컴퓨팅 임시 최종규칙과 이에 상응하는 반도체 제조장비 임시 최종규칙은 2022년 10월 7일 발표된 이전 수출규칙에 비해 훨씬 촘촘하다. 이 규칙의 영향을 받는 주요 기업 중 하나는 그래픽처리장치(GPU)를 설계하고 판매하는 미국 기술기업 엔비디아다. 엔비디아는 인공지능(AI) 소프트웨어 개발을 위해 필요한 그래픽처리장치(GPU)와 관련, 70억달러 규모 중국시장의 90%를 점유하고 있다.
올해 10월 18일 대만 폭스콘사가 주최한 '혼하이 테크 데이'에 전시된 엔비디아의 'HGX AI 슈퍼컴퓨팅 플랫폼'. EPA=연합뉴스

이 회사는 지난해 규칙의 틈새를 찾아 중국 전용버전의 새로운 칩을 출시했다. 하지만 미정부의 규제강화로 중국 사용자가 구매할 수 있는 엔비디아 칩의 전반적인 성능은 앞으로 더 나빠질 전망이다. 챗GPT가 중요한 전환점이 됐다. AI 개발의 미래는 GPU를 가진자와 못가진자, 두 가지 경로로 나뉠 전망이다.

싱가포르 온라인매체 '더 이니티움(The Initium)'은 11일 "만약 1만개의 엔비디아 H100 AI가속칩(2022년 출시)과 같은 강력한 하드웨어를 보유하고 있다면 1조8000억개의 매개변수(파라미터)를 가진 오픈AI의 챗GPT와 유사한 대형모델을 훈련하는 데 약 3개월이 소요된다"며 "반면 그보다 덜 강력한 엔비디아 V100(2017년 출시)을 1만개 갖고 있다면 유사한 소프트웨어를 만드는 데 약 2년이 소요된다"고 전했다. 이러한 대형모델의 개발은 6개월마다 새로운 세대가 등장할 정도로 매우 빠르게 진행되고 있다.

챗GPT로 도드라진 수출규제 허점

지정학적 관점에서 볼 때 AI 빅모델 경쟁은 현시대 핵무기 경쟁과 같다. AI가 핵무기라면, 연산칩은 농축우라늄, 반도체제조 장비는 원심분리기에 해당한다.

미정부는 지난해 10월 첨단컴퓨팅 수출통제 규정의 첫번째 버전에서 첨단컴퓨팅 칩의 제한선을 '단일카드 연산능력이 4800TOPS(1TOPS=초당 1조번 연산) 이상이고 양방향 전송속도가 600GB/s 이상'으로 설정했다. '4800TOPS + 600GB/s'라는 목표는 당시 가장 진보한 엔비디아 A100(2020년 출시)을 기준으로 삼았다.

미정부의 규정이 발표된 뒤 엔비디아는 A100과 동일한 연산능력을 가지고 있지만 전송속도는 400GB/s로 약간 낮은 A800칩을 출시했다. A800 전송속도는 A100보다 낮지만, 경우에 따라 대역폭의 차이가 작업결과에 큰 영향을 미치지는 않는다.

A800은 수출통제법을 우회하기 위해 만들어진 '중국 전용칩'이었다. 이를 통해 중국에 A100을 판매하지 못해 발생한 매출손실을 최대한 보상받았다. 글로벌 사업매출의 1/4을 중국에서 올리는 엔비디아는 당연한 선택이었다. 하지만 미국여론의 주요표적이 됐다. 많은 이들은 A800이 미국 수출통제의 허점을 반영하고 있다며 반드시 이를 메워야 한다고 목소리를 높였다.

올해 10월 수출통제 조정의 특징은 성능밀도라는 새로운 지표가 도입됐다는 점이다. 성능밀도는 칩의 물리적 면적단위당 컴퓨팅성능의 양으로 정의된다. 밀도 지표를 도입한 정책적 의도는 중국이 수출통제를 우회하기 위해 칩렛(하나의 칩에 여러개 칩을 집적) 기술솔루션을 사용해 대규모 연산클러스터를 구축할 가능성을 차단하기 위한 것이다. 칩렛 기술에서 개발자는 다이 투 다이(D2D) 패키징을 활용해 각 칩에 호스팅할 수 있는 프로세서유닛의 수를 늘려 연산성능을 높일 수 있다.

중국 바이런테크놀로지가 자체개발한 AI칩 'BR100'은 D2D 기술을 활용해 높은 컴퓨팅 성능을 달성했다. 이 기술은 중국에서 큰 기대를 불러일으켰다. 많은 이들이 엔비디아의 기술패권을 돌파할 기회로 여기고 있었다. 하지만 이번 규칙 변경으로 중국 기업들이 핵심제품을 계속 개발하는 데 어려움이 커질 전망이다. 모든 주류 AI 연산칩이 수출통제 대상이 될 것이기 때문이다.

구형제품 중 통제선을 벗어난 유일한 제품은 2017년 출시된 엔비디아 V100과 구글 TPUv3뿐이다. 출시 5년이 넘은 칩으로 챗GPT 등 대형모델을 훈련하긴 어렵다.

지난해 수출통제 첫번째 버전이 도입됐을 때는 아직 챗GPT가 출시되지 않았다. 올해 발표된 수출통제2.0 버전은 기술적 세부사항에 대한 고려와 설계가 크게 개선됐다. 미국 비군사 정보부서에서 일반적인 기준을 뛰어넘는 많은 연구가 이뤄졌고, 많은 자원이 동원됐다.

미정부-엔비디아 두더지게임

지난 12개월 동안 전세계의 AI 연구는 역사상 가장 빠른 속도로 발전했다. 그리고 올해 10월 미정부의 수출통제는 이러한 기술발전의 중요성과 영향을 제대로 반영했다. 미국은 지난달 조 바이든 대통령과 시진핑 중국 국가주석의 회담이 열리기 전 이 중대한 소식을 공개하기로 결정했다. 미국은 "다른 모든 것은 협상할 수 있지만 칩은 협상할 수 없다"며 중국의 반발을 완전히 무시했다.

하지만 엔비디아는 포기하지 않았다. 중국 수출용으로 'H20칩'을 선보였다. 더 이니티움은 "새로운 규정이 도입되면서 대부분의 사람들이 중국 대상 AI칩 사업이 완전히 중단될 것이라고 생각했지만 엔비디아는 끈기를 보여줬다"고 전했다.

총 컴퓨팅 성능과 컴퓨팅 성능밀도는 AI 퍼즐의 여러 구성요소 중 2가지에 불과하다. 오늘날 많은 애플리케이션의 또 다른 일반적인 단점은 전송대역폭이다. 대규모 연산클러스터는 종종 카드 간 데이터 전송흐름에 의해 제한되며, 단일 카드의 연산성능을 최대한 활용할 수 없다.

엔비디아 H20칩은 수출규제 산술 밀도제한을 피했기에 중국 고객에게 합법적으로 판매할 수 있다. H20의 컴퓨팅성능은 H100보다 훨씬 떨어지지만 저장용량은 96GB로 H100의 80GB를 뛰어넘는다. 전송속도는 엔비디아의 독자적인 NV링크 기술을 통해 H100과 동일한 900GB/s에 달한다. 전반적으로 H20의 제품전략은 법적한도 내에서 H100의 스토리지 용량과 대역폭을 늘리는 것이었다. 따라서 어떤 면에서는 H20이 H100보다 더 잘 작동할 수도 있다. 하지만 중국정부 차원에서 많은 관심을 갖고 있는 대형모델 훈련 시나리오에서는 H20의 성능이 H100보다 확실히 떨어진다.

그러나 절대적 성능이 가장 중요한 건 아니다. 미정부의 새로운 규정이 발표된 뒤에도 H20은 여전히 중국 사용자가 합법적으로 대량구매할 수 있는 최고의 제품이다. 지난해 A800 출시 때와 비슷한 상황이다. 모두가 효과를 약화시킨 버전이라는 것을 알고 있지만 여전히 최선의 선택이다.

더 이니티움은 "엔비디아는 미정부 규칙의 작은 틈새를 찾아내는 탁월한 능력을 보여줬다. 이는 미정부의 첨단기술 통제에 종종 허점이 생긴다는 것을 보여준다"며 "현재 반도체전쟁은 중국과 미국 간 게임이다. 하지만 엔비디아의 경우를 보면, 거대 다국적 기업이 종종 그렇듯 미정부 대 대기업의 싸움으로 확대되고 있다"고 전했다.

엔비디아에 도전장 내민 중국기업들

중국기업들은 이같은 상황을 적극 활용하고 있다. 텐센트를 비롯한 중국 칩 설계업체들이 미국 수출규제로 엔비디아 고객들이 등을 돌리길 기대하며 자사의 AI칩을 공격적으로 홍보하고 있다.

11일 로이터통신에 따르면 지난 10월 강화된 미국의 전략기술통제로 텐센트 등 대기업뿐 아니라 중국국영 하이광정보기술, 스타트업 일루바타 코어엑스 등 작은 기업들도 엔비디아에 도전장을 내밀었다.

화웨이는 전체 성능에선 뒤처지지만 컴퓨팅성능 면에서 엔비디아 A100과 견줄 수 있는 어센드910B를 홍보하고 있다. 텐센트는 딥러닝 스타트업 엔플레임과 함께 개발한 AI 추론칩 즈샤오를 탑재한 서비스를 추진하면서 엔비디아 일부 칩에 필적하는 성능을 갖고 있다고 선전하고 있다는 후문이다.

엔플레임은 또 AI 훈련가속기 칩인 '윈수이'를, 일루바타 코어엑스는 '톈가이' GPU를 만드는 업체로, 엔비디아의 고급 A100칩을 대체할 수 있는 제품 업그레이드를 홍보하고 있다. 하이광은 새로 출시한 GPU '셴수안 2호'를 엔비디아의 칩 컴퓨팅 플랫폼인 '쿠다'와 호환되도록 설계해 엔비디아 사용자들이 최소한의 설계변경으로 칩을 교체할 수 있도록 마케팅하고 있다.

엔비디아 CEO 젠슨 황은 지난주 싱가포르에서 "중국에 수많은 경쟁기업들이 있다. AI에 집중하는 스타트업이 50개 정도 된다. 특히 화웨이는 강력한 경쟁자"라고 말했다.

대만 이사야리서치의 루시 첸 부사장은 "중국 칩 설계업체들이 주문을 따내더라도 미국이 TSMC 같은 파운드리업체들이 중국과 협력하는 것을 제한하고 있기 때문에 생산능력을 확보하는 데 어려움을 겪을 수 있다"며 "중국 첨단 제조공정과 첨단 패키징용량 대부분은 화웨이가 우선적으로 사용할 가능성이 높다. 스타트업들은 미국의 규제와 생산제한으로 인한 제약을 극복할 수 있는 전략을 세워야 한다"고 말했다.

화이트오크캐피털의 투자책임자 노리 치우는 "미국의 목표는 중국의 AI 역량을 늦추는 것이었지만 실제로는 중국의 자체 개발역량이 강화됐다"며 "중국의 많은 기술기업들은 미국 칩 없이 AI 생태계를 구축하기 위해 노력하고 있다"고 말했다.

김은광 기자 powerttp@naeil.com
김은광 기자 기사 더보기