AI 패권 뒤흔드는 중국 ‘오픈소스’ 모델의 저력

허깅페이스에서 실리콘밸리에 이르기까지 중국의 오픈소스 AI 모델이 빠른 속도로 확산되고 있다. 이러한 상황이 왜 중요한지 살펴본다.

지난 1년은 중국 AI 분야가 전환점을 맞은 시기였다. 2025년 1월 딥시크(DeepSeek)가 추론 모델인 R1을 공개한 이후 중국 기업들은 훨씬 낮은 비용으로 서구의 선도적인 모델들에 비견할 만한 성능을 구현한 AI 모델을 잇달아 선보이고 있다.

2월 첫 주에는 중국의 AI 기업 문샷 AI(Moonshot AI)가 오픈 웨이트 모델 키미(Kimi) K2.5를 공개했다. 이 모델은 초기 벤치마크 일부에서 앤트로픽의 클로드 오퍼스(Claude Opus)와 같은 최상위 시스템에 근접한 성능을 보였다. 하지만 K2.5의 가격은 오퍼스의 약 7분의 1 수준에 불과할 정도로 가격에선 큰 차이가 난다.

AI 모델 공유 플랫폼 허깅페이스(Hugging Face)에서 알리바바의 큐원(Qwen) 시리즈는 2025년과 2026년 가장 많이 다운로드된 모델로 이름을 올린 데 이어, 누적 다운로드 수에서 메타의 라마(Llama) 모델을 추월했다. 최근 MIT 연구에서도 중국 오픈소스 모델들의 총 다운로드 수가 미국 모델들을 넘어섰다는 결과가 나왔다. 이러한 상황에서 전 세계 개발자들은 그 어느 때보다 저렴한 비용으로 다양한 최첨단 AI 모델을 활용할 수 있게 됐다.

중국 오픈소스 모델들은 챗GPT나 클로드와 같은 미국 모델과 중요한 차이가 있다. 미국 모델 대부분은 유료로만 접근할 수 있고 내부를 들여다볼 수 없다. 반면 중국 기업들은 모델의 학습 과정에서 설정된 수치인 ‘가중치’를 공개하기 때문에 누구나 이를 다운로드받아 실행하고, 분석하고, 수정할 수 있다.

이러한 오픈소스 AI 모델이 계속 고도화된다면 단순히 가장 저렴한 최첨단 AI 선택지를 제공하는 데 그치지 않고, 혁신이 일어나는 장소와 표준을 정하는 주체 자체를 바꿔놓을 것이다.

그렇다면 앞으로 어떤 일이 벌어질까?

중국, 오픈소스 전략 지속할 것

딥시크가 R1을 출시했을 때 대부분의 사람들은 그 ‘출처’에 충격을 받았다. 갑자기 어떤 중국 팀이 미국 연구소의 최고 시스템들과 어깨를 나란히 할 수 있는 추론 모델을 내놓았기 때문이다. 그러나 딥시크의 진정한 충격은 국적보다 ‘배포 방식’에 있었다. R1은 대표적인 오픈소스 라이선스인 MIT 라이선스하에 오픈 웨이트 모델로 공개돼 누구나 모델을 다운로드받아 분석하고 배포할 수 있었다. 이와 더불어 딥시크는 모델 학습 과정과 기법을 상세히 설명한 논문도 함께 발표했다. API를 통해 모델에 접근하는 개발자들을 위해서는 당시 선도적인 추론 모델이었던 오픈AI의 o1보다 훨씬 낮은 가격에 서비스를 제공했다.

출시 며칠 만에 딥시크는 챗GPT를 제치고 미국 앱스토어에서 가장 많이 다운로드된 무료 앱 자리를 차지했다. 그 여파는 개발자 커뮤니티를 넘어 금융 시장으로까지 확산됐다. 미국 기술주가 급락하면서 한때 약 1조 달러(약 1,450조 원)에 달하는 시가총액이 증발했다. 퀀트 헤지펀드의 지원을 받던 거의 무명의 연구팀이었던 딥시크는 거의 하룻밤만에 중국의 오픈소스 AI 전략을 상징하는 대표적인 존재로 떠올랐다.

오픈소스에 집중하는 중국의 전략은 놀라운 일이 아니다. 중국은 미국에 이어 세계에서 두 번째로 많은 AI 인재를 보유하고 있으며 막대한 자원과 인프라를 갖춘 기술 산업 기반을 갖추고 있다. 챗GPT가 대중화된 이후 중국 AI 산업은 위기의식을 느끼며 빠르게 격차를 줄이겠다는 결의를 다졌다. 오픈소스 전략은 개발자들을 결집시키고 모델을 확산시켜 표준을 선점하는 가장 빠른 방법으로 여겨졌다.

딥시크가 성공하면서 중국 기술 산업계는 자신감을 얻었다. 중국의 AI 에이전트 기업 아톰스(Atoms)의 창립자이기도 한 알렉스 청린 우(Alex Chenglin Wu) CEO는 “30년 전만 해도 중국인이 글로벌 혁신의 중심에 설 수 있다고 믿는 사람은 없었을 것”이라며 “딥시크는 탄탄한 기술 인재, 적절한 지원, 올바른 조직 문화가 갖춰지면 중국 기업도 세계적 수준의 성과를 낼 수 있다는 것을 보여줬다”고 설명했다.

딥시크의 돌풍은 중국 AI 업계에서 개방형 모델 전략이 처음 거둔 성공 사례는 아니다. 알리바바 산하 큐원 랩(Qwen Lab)은 이미 수년 전부터 학습 가중치를 공개한 오픈 웨이트 모델을 선보였다. 딥시크 V3가 출시되기 훨씬 전인 2024년 9월에 알리바바는 전 세계 다운로드 수가 6억 건을 넘었다고 밝혔다. 허깅페이스에서는 큐원 시리즈가 2024년 한 해 동안 전체 모델 다운로드의 30% 이상을 차지했다. 베이징 AI 아카데미(Beijing Academy of Artificial Intelligence)와 AI 기업 바이촨(Baichuan) 등 다른 기관들도 2023년부터 오픈 모델을 공개해왔다.

그러다 딥시크가 성공하면서 오픈소스 모델 분야는 더욱 빠르게 확장되기 시작했다. Z.ai(구 즈푸(Zhipu)), 미니맥스(MiniMax), 텐센트 등 여러 기업과 소규모 연구소들이 추론, 코딩, 에이전트형 작업에서 경쟁력 있는 모델을 내놓고 있다. 유능한 모델의 수가 늘어나면서 발전 속도도 빨라졌다. 과거에는 오픈소스 분야까지 기술이 확산되는 데 수개월이 걸렸지만 이제는 몇 주, 심지어 며칠밖에 걸리지 않는다.

칭화대학교 컴퓨터공학과 교수이기도 한 AI 스타트업 모델베스트(ModelBest)의 류즈위안(Liu Zhiyuan) 최고과학자는 “중국 AI 기업들은 오픈소스 전략을 통해 실질적인 성과를 거두고 있다”며 “강력한 연구 성과를 공개함으로써 평판을 쌓고 무료 홍보 효과도 얻는다”고 설명했다.

류 최고과학자는 오픈소스가 상업적 유인을 넘어 문화적, 전략적 의미까지 갖게 됐다고 덧붙였다. 그는 “중국 프로그래머 커뮤니티에서는 오픈소스가 일종의 ‘정치적으로 올바른’ 선택이 됐다”며 이를 미국의 독점 AI 시스템에 대한 대응으로 해석했다.

이러한 변화는 제도 차원에서도 나타나고 있다. 칭화대를 비롯한 여러 대학이 AI 개발과 오픈소스 활동을 장려하기 시작했으며 정책 당국도 이를 제도화하려 하고 있다. 8월에는 중국 국무원에서 대학이 오픈소스 활동을 보상하도록 장려하는 정책 초안을 발표하면서 깃허브(GitHub)나 기티(Gitee) 같은 오픈소스 플랫폼에 학생이 기여할 경우 이를 학점으로 인정하는 방안도 제시됐다.

허깅페이스에서 글로벌 AI 관련 업무를 이끄는 톄전 왕(Tiezhen Wang) 책임자는 “이러한 흐름을 볼 때 단기적으로 중국의 오픈소스 모델 전략은 지속될 가능성이 크다”면서 “다만 장기적인 지속 가능성은 결국 금전적 성과에 달려 있다”고 지적했다. 1월에는 Z.ai와 미니맥스가 홍콩 증시에 상장했다. 왕 책임자는 “지금은 시장의 규모를 더 키우는 데 집중할 단계”라면서 “다음 과제는 각 기업이 어떻게 자신의 몫을 확보하느냐”라고 말했다.

차세대 모델, 특정 분야에 더 특화되고 더 뛰어나질 것

중국의 오픈소스 모델은 다운로드 규모뿐 아니라 다양성 측면에서도 선도적인 위치에 있다. 가령 알리바바의 큐원은 현재 유통되는 오픈 모델 가운데 가장 다각화된 모델군으로, 다양한 용도에 최적화된 여러 변형 모델을 제공한다. 단일 노트북에서 구동할 수 있는 경량 모델부터 데이터센터 배치를 염두에 둔 수천억 개 파라미터를 갖춘 대형 시스템까지 다양하다. 또한 다양한 작업에 특화된 모델들도 있다. ‘인스트럭트(instruct)’ 모델은 지시 수행에 강하고 ‘코드(code)’ 모델은 코딩에 특화돼 있다.

물론 이러한 전략은 중국 연구소만의 전유물이 아니다. 그러나 큐원은 이처럼 다양한 고품질 선택지를 한꺼번에 선보여 마치 하나의 제품군처럼 느껴지게 한 최초의 오픈 모델이었다. 그것도 무료로 사용할 수 있는 형태로 말이다.

큐원은 오픈 웨이트 방식으로 공개된 덕분에 다른 개발자들도 미세조정이나 증류(distillation), 즉 대형 모델의 성능을 모방하도록 소형 모델을 학습시키는 방법과 같은 기법을 통해 쉽게 변형할 수 있다. 미국의 네이선 램버트(Nathan Lambert) AI 연구원이 진행하는 ATOM(American Truly Open Models) 프로젝트에 따르면 2025년 8월 4일 기준 허깅페이스에 새로 올라온 언어모델 파생 모델 중 큐원 기반 모델이 ‘40% 이상’을 차지했다. 반면 메타의 라마는 약 15% 수준으로 떨어졌다. 이는 큐원이 각종 ‘변형’의 기본 모델로 자리 잡았음을 의미한다.

이 같은 흐름은 더 작고 더 특화된 모델의 필요성을 보여준다. 모델베스트의 류 최고과학자는 “연산 자원과 에너지는 어떤 환경에서든 실질적인 제약 요인”이라고 지적했다. 그는 MIT 테크놀로지 리뷰와의 인터뷰에서 “소형 모델의 부상은 AI 운영 비용을 줄이고 더 많은 사람이 쉽게 활용할 수 있게 하는 데 목적이 있다”고 설명했다. 모델베스트는 휴대전화, 자동차, 기타 소비자 기기 등에서 로컬로 구동할 수 있도록 설계된 소형 언어모델 개발에 집중하고 있다.

일반 사용자는 웹이나 앱을 통해 간단한 대화를 나누는 방식으로만 AI를 접할 수 있지만, 기술적 배경을 갖춘 ‘파워 유저’들은 AI에 더 큰 자율성을 부여해 대규모 문제를 해결하는 방안을 실험하고 있다. 최근 AI 해커 커뮤니티에서 화제가 된 오픈소스 AI 에이전트 ‘오픈클로(OpenClaw)’는 AI가 사용자의 컴퓨터를 직접 제어하게 함으로써 24시간 내내 이메일과 업무를 감독 없이 처리할 수 있다.

오픈클로를 비롯한 많은 오픈소스 도구는 API를 통해 다양한 AI 모델에 연결할 수 있다. 개발팀은 오픈클로 출시 며칠 만에 키미 K2.5가 클로드 오퍼스를 제치고 가장 많이 사용되는 AI 모델이 됐다고 밝혔다. 여기서 사용량은 토큰(token, 모델이 처리하는 텍스트 단위) 기준으로, 사용자 입력과 모델 응답을 포함한 총 처리 텍스트 양을 의미한다.

중국 모델이 확산된 주요 이유 중 하나는 가격 경쟁력이지만, 허깅페이스의 왕 책임자는 “이를 서구 최첨단 시스템의 단순한 ‘복제품’으로만 보아서는 안 된다”고 강조했다. 다른 제품과 마찬가지로 AI 모델 또한 필요한 작업에 적합하기만 하다면 충분하기 때문이다.

중국 내 오픈소스 모델들도 점점 더 전문화되고 있다. 상하이 AI 연구소와 같은 연구 그룹은 과학, 기술 작업에 특화된 모델을 내놓았고, 텐센트의 여러 프로젝트는 음악 생성에 집중하고 있다. 딥시크의 모회사 하이플라이어(High-Flyer)와 같은 퀀트 금융 기업인 유비퀀트(Ubiquant)는 의료 추론에 초점을 맞춘 오픈 모델을 공개했다.

한편 중국 연구소들의 혁신적인 아키텍처 아이디어는 더 폭넓게 채택되고 있다. 일례로 딥시크는 모델 효율성과 메모리 사용에 관한 연구를 발표했는데, 모델의 어텐션 캐시를 압축해 메모리 사용량과 추론 비용을 줄이면서도 성능은 대부분 유지하는 기법이 연구 커뮤니티에서 큰 주목을 받고 있다.

왕 책임자는 “이러한 연구 혁신은 오픈소스로 공개되기 때문에 영향력이 더 커진다”며 “AI 분야 전반에 빠르게 확산될 수 있다”고 강조했다.

중국 오픈 모델, 글로벌 AI 개발자들의 인프라 될 것

실리콘밸리에서도 중국 모델 활용이 늘고 있다. 미국 벤처캐피털 앤드리슨 호로위츠(Andreessen Horowitz)의 마틴 카사도(Martin Casado) GP는 이를 수치로 제시했다. 그는 X에 올린 글에서 “오픈소스 스택을 기반으로 투자 유치를 시도하는 스타트업의 경우 약 80%가 중국 오픈 모델을 사용하고 있다”고 밝혔다. 사용 데이터도 비슷한 흐름을 보여준다. 다양한 AI 모델의 API 기반 사용 현황을 추적하는 API 플랫폼 오픈라우터(OpenRouter)에 따르면 중국 오픈 모델의 사용 비중은 2024년 말 거의 ‘제로’ 수준에 불과했지만 최근 몇 주 사이 약 30%에 육박할 정도로 증가했다.

글로벌 수요도 증가하고 있다. Z.ai는 자사 대표 모델 GLM을 기반으로 한 코딩 도구 ‘GLM 코딩 플랜’의 신규 구독을 일시 제한했다. 이유는 수요 급증으로 인한 연산 자원 제약이었다. 주목할 점은 수요의 출처다. CNBC 보도에 따르면 해당 시스템의 사용자 기반은 주로 미국과 중국에 집중돼 있으며 그 뒤를 인도, 일본, 브라질, 영국이 잇고 있다.

왕 책임자는 “중국과 미국의 오픈소스 생태계는 긴밀하게 얽혀 있다”고 설명했다. 많은 중국 오픈 모델이 여전히 엔비디아 칩과 미국 클라우드 플랫폼에 의존해 학습하며 서비스를 제공하고 있어 사업적 연결고리가 복잡하게 얽혀 있다. 인재 이동도 활발하다. 연구자들은 국경과 기업을 넘나들며 이동하고, 여전히 공개 공간에서 코드와 아이디어를 공유하며 활동하는 경우가 많다.

이 같은 상호의존성을 바탕으로 중국 개발자들은 현재 상황을 낙관적으로 보고 있다. 연구 성과가 국경을 넘어 확산되고 서로 혼합되며 실제 제품에 적용되기 때문이다. 그러나 개방성은 경쟁도 가속화할 수 있다. 앤트로픽의 다리오 아모데이(Dario Amodei) CEO는 2025년 딥시크가 모델을 공개한 이후 이와 비슷한 취지의 발언을 했다. 그는 “수출 통제는 미-중 경쟁을 피하는 방법이 아니”라면서 “미국 AI 기업이 우위를 지키려면 더 나은 모델을 보유해야 한다”고 강조했다.

지난 10년간 서구에서는 중국 기술 업계가 처음에 어떤 제품이나 기술로 큰 기대를 받더라도 결국 규제와 정치적 반발에 부딪히는 모습을 목격해왔다. 그러나 이번에 중국이 ‘수출’하고 있는 것은 단순한 앱이나 소비자 플랫폼이 아니다. 다른 이들이 그 위에 제품을 구축할 수 있는 ‘기저 모델’이다. 이러한 AI 인프라 수출이 기존과 같은 상황으로 귀결될지 아니면 다른 결과로 이어질지는 아직 알 수 없다.

The post AI 패권 뒤흔드는 중국 ‘오픈소스’ 모델의 저력 appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.