내일시론

량원펑이 딥시크를 만든 까닭

2025-02-10 13:00:07 게재

새해 시작부터 밀어닥친 딥시크의(DeepSeek) 기술 충격과 트럼프 관세전쟁 공포는 앞으로 한국경제가 겪을 험난한 길을 예고한다. 특히 인공지능(AI) 세계에서 미국의 기술봉쇄로 실리콘밸리의 추격자 신세이자, 변방으로 치부됐던 중국의 AI스타트업이 이룬 저비용 고효율의 대규모언어모델(LLM) 성과는 우리나라 AI 산업 관계자들에게 더 큰 충격을 안겼을 것이다.

그러나 이제 충격을 딛고 일어나 딥시크가 ‘어떻게’ 가능했는지와 딥시크를 ‘왜’ 만들었는지 분석해보면서 ‘왜 우리는 이런 창의적 AI 스타트업을 키우지 못했는지’, '왜 우리는 글로벌 AI 경쟁에서 밀렸는지' 뼈아픈 질문의 시간을 가져야 할 때다.

기존 LLM 시스템의 고비용 문제를 돌파하기 위한 기술 혁신

딥시크의 ‘어떻게’는 이미 많은 분석을 통해 나와 있다. 저사양 칩(H800 GPU)으로 오픈AI의 챗GPT-4o와 비슷한 성능을 냈다는 것, 미국의 기술 봉쇄에도 자체적으로 개발했다는 것, 엔비디아의 GPU 운영 시스템인 쿠다(CADA) 플랫폼을 우회했고 성능을 높이는 길을 새롭게 찾았다는 것, 오픈 소스를 채택했다는 것 등이다. 우리나라 언론들은 빅테크의 천문학적인 비용 대비 딥시크의 싼 비용에 초점을 맞추고 있는데 사실 구글에서 ‘low cost deepseek’를 입력해서 팩트체크(Artificial Analysis AI Review, 2024 Highlights)를 해보면 실상과 많이 다르다.

비용만으로 보자면 구글의 Gemini 1.5 Flash(1만 토큰 당/input 대비 output price)가 0.07/0.3달러로 가장 낮고, 딥시크 V3 0.9/1.1달러, 딥시크 R1 2/2.5달러, 챗GPT-4o 2.5/10달러, 메타의 라마(LLaMa 3.1 405B) 3.5/3.5달러, 챗GPT-4 30/60달러다.

딥시크 홈페이지의 ‘테크니컬 리포트’에서 V3의 비용을 보면 H800 GPU를 1시간당 2달러로 지불하고 내는 비용을 기준으로 557만달러를 사용했다고 기록돼 있는데 이는 오직 공식적 훈련만 계산한 것으로 사전에 리서치 등 여러 가지 준비 활동 등에 따른 비용은 제외했다고 밝히고 있다.(Our total training costs amount to only $5.576M, Note that the aforementioned costs include only the official training of DeepSeek-V3, excluding the costs associated with prior research and ablation experiments on architectures, algorithms, or date.)

그럼에도 불구하고 딥시크가 기존 LLM 시스템의 고비용 문제를 돌파하기 위해 미국의 대중 제재로 성능이 떨어지는 엔비디아 GPU를 사용할 수밖에 없는 한계를 엔지니어링 최적화를 통해 극복하려 했고, 결국 강화학습(RL) 모델학습 그리고 추론에서 메모리 계산량을 줄이는 기술을 개발한 혁신은 획기적인 것이다.

딥시크를 창업한 량원펑은 중국 AI의 주류인 칭화대나 베이징대가 아닌 저장성 항저우 저장대에서 2010년 전자정보학 학·석사 과정을 마치고 2016년 퀀트펀드를 운용하는 헤지펀드 환방(영문 High Flyer)를 창업했고 딥시크는 환방의 자회사다. 딥시크 이전에 거의 알려지지 않은 인물이라 데이터가 거의 없는데 2024년 딥시크 V3 발표 이후 AI 업계에 이목을 집중시키면서 유일하게 ‘암류(WAVES)’ 라는 매체와 인터뷰한 내용을 찾아봤다. (‘암류’의 인터뷰 내용은 영어로 번역돼 있는데 량원펑에 대한 정보와 인터뷰 내용은 챗GPT를 통한 질문과 구글 제미나이의 번역을 사용했다)

기술 혁명의 추격자가 아닌 ‘0에서 1’로 가는 길

량원펑은 미국은 0에서 1을 만들어내는 혁신(페이팔 마피아의 원조인 피터 틸이 창안한 개념인 'ZERO TO ONE'의 수직적 진보)에 능하고, 중국은 그 혁신을 이용해 1에서 10을 만들어내는 응용에 익숙한 관성(수평적 진보 또는 글로벌화, 제조 등의 최적화)을 벗어나고자 했다.

그는 “지난 30년 동안 IT 혁명에서 중국 회사들은 다른 사람이 기술 혁신을 하고, 우리는 그것을 가져와 응용으로 현금화 하는 데 익숙해졌지만 그것은 당연한 것이 아니다”고 말한다. 아울러 “중국 AI가 미국보다 1~2년 뒤쳐져 있다고 하지만 실제 격차는 시간의 문제가 아니라 ‘창의적 혁신’과 ‘모방’의 차이이고, 이 부분이 바뀌지 않는다면 중국은 영원히 따라가기만 할 수밖에 없다고 밝혔다.

량원펑의 ‘왜’는 기술 혁명의 추격자가 아닌 ‘0에서 1’로 가는 길에 있는 것 같다. 그는 세계적인 혁신 흐름에 무임승차가 아닌 기여자로서 게임에 참여했고, 혁신에서 부족한 것은 돈이 아니라 자신감과 고밀도의 인재를 조직화해 효과적인 혁신을 이루는 방법임을 강조한다. 그는 늘 열정과 호기심을 기준으로 인재를 선발했다고 한다.

안찬수 오피니언실장

안찬수 기자 기사 더보기