경제시평
인공지능과 오픈 소스
오픈 소스는 컴퓨터를 활용해 만드는 여러 가지 소프트웨어를 일반 대중이나 다른 경쟁 회사가 개방하는 것으로 1990년대 리눅스 운영체제의 출현과 함께 많이 통용되는 기법이다. 음식 조리법을 숨기는 것 없이 그대로 공개해서 같은 음식을 만들 수 있는 원리와 같다.
최근 인공지능(AI) 오픈 소스가 경쟁적으로 이뤄지고 있다. 2010년 후반 AI 오픈 소스는 모델은 공개하되 핵심인 파라미터는 공개하지 않았으나 최근에는 이 트렌드가 급속도로 바뀌고 있다. 이제는 모델, 파라미터에 더해서 AI 훈련에 사용된 데이터까지도 같이 공개하는 것이 중요한 트렌드로 자리잡았다.
AI 훈련 데이터 공개, 중요한 트렌드로 자리잡아
이런 AI들이 가장 많이 공개되는 사이트는 허깅 페이스(HuggingFace)라는 미국의 스타트업이 운영하는 오픈소스 커뮤니티 툴이다. 2026년 3월 11일을 기준으로 약 270만개의 AI 모델, 91만여개 데이터가 공개돼 있다. 물론 무분별한 상업적 활용은 제어할 수 있는 라이선스 조건을 붙여서 공개하기 때문에 사전 동의 없이 상업용 활용이 불가능하나, 적절한 동의만 얻으면 경쟁사도 활용할 수 있다.
구글 마이크로소프트 메타 같은 미국의 빅테크 기업과 알리바바 바이두 같은 중국 빅테크들이 오픈 소스 공개를 경쟁하고 있다. 또한 딥시크 같은 AI 스타트업, 미국과 중국의 주요 대학의 연구소, 프랑스의 미스트랄과 같은 AI 추격 국가의 신생 스타트업들도 공개 행렬에 동참하고 있다. 한국 기업도 과거와는 다르게 네이버나 카카오 같은 인터넷 기업들이 공개에 나서고 있다.
많은 돈을 들여 모으고 개발한 AI 데이터와 모델을 왜 모든 사람들이 다 활용할 수 있게 무료로 공개하는 것일까? 그 이유를 이해하면 AI를 통한 비즈니스가 전세계적으로 어떻게 전개되는지 이해하는 데 큰 도움이 된다. 먼저 규모가 작은 대학의 연구소나 스타트업들은 자신들의 모델을 공개해 전세계적인 주목을 끌 가능성을 기대한다. 대표적으로 성공한 경우가 딥시크의 R1 모델이다. AI 훈련에 초가성비를 실현하면서도 높은 성능을 유지한 것으로 막대한 홍보 효과와 후속 투자 유치에 성공했다.
그럼 구글 알리바바 같은 빅테크들에게 어떤 유인 요소가 있을까? 허깅 페이스 사이트에 살펴보면 그 이유를 쉽게 알 수 있다. 알리바바는 거의 모든 모델을 오픈 소스 언어모델 QWEN으로 시작하는데, 모델을 돌려본 후 성능이 기대에 충족한다면 상업적 서비스를 받는 계약을 진행할 수 있다고 홍보한다. 즉 자신들이 개발한 AI 알고리즘을 자기들이 보유한 AI 슈퍼컴퓨터에서 최적의 상태로 서비스할 수 있는 환경을 만든 후 고객을 유인하고 있는 것이다. AI를 개발하고 훈련하는 것도 중요하지만 실제 서비스 과정에서 클라우드 환경에서 발생하는 비즈니스 규모가 훨씬 크고 중요한 비즈니스 모델이기 때문이다.
세계 플레이어들과 함께 할 발상의 전환 필요
한국은 인터넷 시대부터 소프트웨어 생태계의 폐쇄성이 너무 커서 오프 소스 프로젝트에 회사 이름으로는 참여하기 어렵다. 전통적 대기업들은 오픈 소스 커뮤니티에 참여가 저조하다. 글로벌 클라우드 서비스 인프라가 취약해 비즈니스에 도움이 되는 방안이 없기 때문인 것이 더 타당한 이유일 것이다.
이제 우리도 과감한 전환이 필요할 때다. AI 알고리즘 개발 해커톤이 아닌 허깅 페이스의 오픈 소스 모델을 빠르게 구현, 서비스 할 수 있는 환경을 만들어 내는 해커톤을 운영해야 한다.
자사의 제조 AI와 자율주행 AI 모델을 개발하는 인프라를 내부사용에 머물지 않고 향후 세계의 모든 플레이어들이 들어와서 각자의 AI 모델 훈련, 서비스에 적용할 수 있는 인프라와 비즈니스로 키워가는 발상의 전환이 각별히 필요할 때이다.