DeepSeek V3.1 – OpenAI 및 관련 기업에 대한 경고: 중국의 오픈소스 AI가 기존 공급업체에 새로운 도전 과제를 제기하고 있습니다

Konrad Wolfenstein

10개월 전

DeepSeek V3.1 – OpenAI 및 관련 업체에 대한 경고: 중국의 오픈소스 AI가 기존 공급업체에 새로운 도전 과제를 제기하고 있다 – 이미지: Xpert.Digital

중국에서 새로운 AI 모델이 등장했습니다. 이 무료 모델은 기존 모델보다 27배 저렴하며 ChatGPT에 정면으로 도전합니다

### 오픈아이디어(OpenAI) 및 관련 기업에 경고: 중국의 새로운 AI는 강력하지만 가격은 훨씬 저렴하다. 그 배후는 무엇일까? ### 딥시크(DeepSeek) V3.1: 기술계를 뒤흔드는 조용한 AI 공격 ### 비싼 AI는 잊으세요: 이 중국 오픈소스 모델이 모든 것을 바꾸는 이유 ### 중국의 새로운 초강력 AI: 베이징이 급진적인 자유 전략으로 서방에 압력을 가하는 방법 ### 경쟁사보다 더 좋고 더 저렴한가? 중국의 새로운 경이로운 AI가 실제로 할 수 있는 일은 무엇일까? ###

DeepSeek V3.1은 (또 한 번) AI 지형을 혁신합니다

중국의 인공지능 기술이 미국 IT 대기업들에게 심각한 위협으로 떠오르고 있습니다. 항저우에 위치한 스타트업 딥시크(DeepSeek)는 최신 모델인 V3.1을 통해 인공지능 개발 및 투자에 대한 기존의 통념을 근본적으로 뒤흔드는 획기적인 성과를 거두었습니다. 이 오픈소스 모델은 선도적인 독점 시스템과 동등한 성능을 훨씬 저렴한 개발 비용으로 구현하며, 인공지능의 새로운 미래를 제시하고 있습니다.

이와 관련된 내용:

딥시크: 감시의 그림자 아래 놓인 중국의 AI 혁명 – 워싱턴발 심각한 의혹 제기

하이브리드 아키텍처를 활용한 기술 혁신

DeepSeek V3.1은 총 6,850억 개의 파라미터를 가진 고급 전문가 혼합(Mixture of Experts) 아키텍처를 기반으로 하며, 이 중 370억 개의 파라미터가 토큰당 활성화됩니다. 이 기술은 성능 저하 없이 기존 모델보다 훨씬 효율적인 리소스 활용을 가능하게 합니다.

새 모델의 가장 두드러진 특징은 '사고 모드'와 '비사고 모드'를 전환할 수 있는 하이브리드 추론 아키텍처입니다. 사고 모드에서는 시스템이 심층적인 내부 추론 과정을 개발하여 여러 단계의 논리적 사고가 필요한 복잡한 문제 해결에 이상적입니다. 반면, 비사고 모드는 속도가 중요한 작업에 대해 직접적이고 간결한 답변을 제공합니다.

또 다른 기술적 발전은 128,000개의 토큰으로 확장된 컨텍스트 창입니다. 이는 약 96,000개의 단어 또는 200페이지 분량의 소설 두 권에 해당합니다. 이러한 기능을 통해 매우 긴 문서를 처리하고, 전체 코드 저장소를 이해하며, 다단계 대화 시나리오를 처리할 수 있습니다.

컨텍스트 확장을 위한 2단계 접근 방식을 통해 추가적인 개발이 이루어졌습니다. 32,000개 토큰 단계는 10배 확장되어 6,300억 개의 토큰을 처리하게 되었고, 128,000개 토큰 단계는 3.3배 증가하여 2,090억 개의 토큰을 처리하게 되었습니다. 또한, 이 모델은 최신 하드웨어 아키텍처와의 최적의 호환성을 위해 UE8M0 FP8 데이터 형식을 활용합니다.

인상적인 성능 지표 및 벤치마크

DeepSeek V3.1은 표준화된 테스트에서 놀라운 결과를 보여줍니다. 유명한 Aider 코딩 벤치마크에서 이 모델은 71.6%의 점수를 기록했는데, 이는 OpenAI와 Anthropic의 선두 모델들과 견줄 만한 점수입니다. 특히 훨씬 낮은 개발 비용을 고려하면 이러한 성능은 매우 인상적입니다.

수학 연산 작업에서 DeepSeek V3.1은 기존 경쟁 제품들을 능가합니다. Math-500 테스트에서 DeepSeek V3.1은 90.2%의 정확도를 달성한 반면, GPT-40은 74.6%에 그쳤습니다. MMLU-Pro 테스트에서는 5.3점 향상된 81.2%를 기록했고, GPQA 벤치마크에서는 무려 9.3점이나 향상된 68.4%를 달성했습니다.

특히 주목할 만한 점은 다단계 추론 작업에서 버전 3.1이 이전 버전보다 43% 향상된 성능을 보인다는 것입니다. 이 모델의 프로그래밍 기능은 최대 700줄에 달하는 오류 없는 코드를 생성할 수 있게 해 주는데, 이는 고가의 독점 솔루션에 필적하는 성능입니다.

혁신적인 비용 효율성

DeepSeek V3.1의 비용 구조는 AI 개발에 대한 기존의 통념을 완전히 뒤집습니다. V3.1을 사용한 프로그래밍 작업 비용은 약 1달러인 반면, 유사한 시스템은 같은 작업에 거의 70달러를 청구합니다. 이러한 획기적인 비용 절감으로 인해 고급 AI 기술을 소규모 기업과 개발자들도 이용할 수 있게 되었습니다.

회사에 따르면, V3 모델의 개발 비용은 약 560만 달러에 불과했는데, 이는 미국 기업들이 유사한 프로젝트에 수억 달러를 투자하는 것에 비하면 극히 일부에 지나지 않습니다. 이러한 효율성은 혁신적인 훈련 방식과 성능은 낮지만 가격이 저렴한 하드웨어를 사용함으로써 달성되었습니다.

DeepSeek의 API 가격은 경쟁사보다 훨씬 저렴합니다. 채팅 모델은 캐시 적중 시 입력 토큰 100만 개당 0.07달러, 출력 토큰 100만 개당 1.10달러입니다. 추론 모델은 입력 토큰 100만 개당 0.14달러, 출력 토큰 100만 개당 2.19달러입니다. OpenAI는 출력 토큰 100만 개당 약 2달러에서 2.5달러를 청구하는 반면, DeepSeek는 단 0.014달러만 청구합니다.

글로벌 AI 경쟁에서 전략적 중요성

딥시크의 성공은 전 세계 AI 환경에 광범위한 영향을 미칠 것입니다. 이 회사는 첨단 AI 성능을 구현하는 데 더 이상 막대한 자원과 독점적인 접근 방식이 필요하지 않다는 것을 입증했습니다. 이는 기존 비즈니스 모델의 근간을 뒤흔드는 발전입니다.

중국 지도부는 딥시크에 높은 전략적 중요성을 부여하고 있으며, 이는 창업자 량원펑과 리창 총리의 만남에서 분명히 드러납니다. 딥시크는 중국이 2030년까지 인공지능 분야의 세계적인 선두주자가 되려는 야망을 실현하는 데 핵심적인 요소로 여겨지고 있습니다.

딥시크의 오픈소스 전략은 전 세계의 다른 기업과 연구자들이 딥시크의 성과를 기반으로 자체적인 혁신을 개발할 수 있도록 합니다. 이는 인공지능 기술의 분산된 발전을 촉진하고 특정 기술 대기업에 대한 의존도를 줄입니다.

회사 배경 및 구조

딥시크는 2023년 항저우에서 량원펑(Liang Wenfeng)에 의해 설립되었으며, 중국 헤지펀드인 하이플라이어(High-Flyer)로부터 전액 투자를 받았습니다. 1985년 초등학교 교사의 아들로 태어난 량원펑은 저장대학교 재학 시절 금융 분야에 인공지능을 적용하는 데 관심을 갖게 되었습니다.

2016년, 원펑은 머신러닝을 활용한 양적 거래 전략을 구사하는 헤지펀드인 하이플라이어를 설립했습니다. 2021년까지 하이플라이어는 인공지능 기반 거래 방식으로 완전히 전환하여 운용자산 1,000억 위안 이상을 보유한 중국 최고의 양적 투자 펀드 중 하나로 성장했습니다.

딥시크를 설립하기 전부터 원펑은 수천 대의 엔비디아 GPU를 구매하기 시작했는데, 처음에는 억만장자의 별난 취미로 비웃음을 샀습니다. 하지만 이러한 선견지명 있는 하드웨어 투자는 훗날 미국 수출 제한에도 불구하고 회사가 경쟁력 있는 AI 모델을 개발할 수 있도록 해주었습니다.

EU/독일 데이터 보안 | 모든 비즈니스 요구사항을 위한 독립적이고 다양한 데이터 소스를 지원하는 AI 플랫폼 통합

유럽 기업을 위한 전략적 대안으로서의 독립형 AI 플랫폼 - 이미지: Xpert.Digital

AI 판도를 바꾸는 혁신: 가장 유연한 AI 플랫폼 - 비용 절감, 의사 결정 개선 및 효율성 증대를 위한 맞춤형 솔루션

독립형 AI 플랫폼: 회사 관련 모든 데이터 소스를 통합합니다

신속한 AI 통합: 기업 맞춤형 AI 솔루션을 몇 달이 아닌 몇 시간 또는 며칠 내에 제공합니다
유연한 인프라: 클라우드 기반 또는 자체 데이터 센터 호스팅(독일, 유럽, 위치 자유 선택 가능)

최고의 데이터 보안: 로펌에서의 사용 사례가 이를 명백히 입증합니다
다양한 엔터프라이즈 데이터 소스에 걸친 배포
자체 AI 모델 또는 다른 AI 모델(독일, 유럽, 미국, 중국) 선택 가능

자세한 내용은 여기에서 확인하세요:

독립형 AI 플랫폼과 하이퍼스케일러 중 어떤 솔루션이 적합할까요?

칩, 알고리즘, 혁신: DeepSeek의 세계 정상으로 가는 길

미국 수출 통제의 영향

미국이 중국에 고성능 AI 칩 수출을 제한한 상황에서 딥시크의 성공은 특히 주목할 만합니다. 이러한 제재는 중국의 첨단 AI 시스템 개발 능력을 제한하기 위한 것이었지만, 딥시크는 혁신적인 소프트웨어 접근 방식과 효율적인 자원 활용을 통해 이러한 제약을 극복할 수 있음을 보여줍니다.

이 회사는 중국 수출 승인을 받은 비교적 성능이 낮은 H800 칩을 사용했지만, 최적화된 알고리즘과 효율적인 학습 방법을 통해 최고의 성능을 달성했습니다. 이러한 접근 방식은 기술 제재의 실효성에 의문을 제기하고 인공지능 개발을 위한 대안적인 길을 제시합니다.

전문가들은 딥시크의 이번 성과가 중국의 인공지능 역량과 잠재력에 대한 기존 평가를 근본적으로 바꿀 수 있는 전환점이 될 수 있다고 보고 있습니다. 이번 개발은 단순한 하드웨어 우위보다 소프트웨어 최적화 혁신이 더 중요할 수 있음을 시사합니다.

이와 관련된 내용:

중국의 인공지능 분야 추격전: 딥시크 사례와 데이터의 전략적 활용

오픈소스는 경쟁 우위 요소입니다

DeepSeek의 오픈 소스 전략은 여러 가지 전략적 이점을 제공합니다. 전 세계 개발자와 기업은 클라우드 서비스에 의존하지 않고도 모델을 로컬에서 실행, 맞춤 설정 및 자체 프로젝트에 통합할 수 있습니다. 이는 데이터에 민감한 애플리케이션이나 정보에 대한 통제권을 유지하고자 하는 기업에게 특히 중요합니다.

커뮤니티 기반 개발은 버그 수정 속도를 높이고 지속적인 개선을 가능하게 하며, 폭넓은 기여자 기반을 구축할 수 있도록 합니다. 동시에 오픈 소스 방식은 첨단 AI 기술에 대한 접근성을 민주화하고, 중소기업과 개발도상국을 포함한 모든 분야에서 혁신을 촉진합니다.

API나 클라우드 플랫폼을 통해서만 접근 가능한 독점 모델과 달리, 오픈소스 AI는 장기적인 가용성과 특정 공급업체에 대한 독립성을 제공합니다. 사용자는 가격 인상, 접근 제한 또는 서비스 중단에 대해 걱정할 필요가 없습니다.

기술적 돌파구와 혁신

DeepSeek V3.1은 탁월한 효율성을 가능하게 하는 여러 혁신적인 기술을 통합했습니다. 멀티 헤드 잠재 어텐션 아키텍처는 잠재 벡터를 사용하여 키-값 캐시를 압축함으로써 추론 과정에서 메모리 사용량과 계산 오버헤드를 줄입니다.

다중 토큰 예측 방식은 각 토큰이 여러 미래 토큰을 동시에 예측할 수 있도록 합니다. 이는 기존 자기회귀 모델의 주요 병목 현상을 극복하고 정확도와 추론 속도를 모두 향상시킵니다.

8비트 학습을 사용하면 정확도를 저하시키지 않으면서 메모리 요구 사항과 비용을 크게 줄일 수 있습니다. 이 기술은 오랫동안 문제가 있는 것으로 여겨졌지만, DeepSeek은 올바르게 구현할 경우 기존 방식과 유사한 결과를 얻을 수 있음을 입증했습니다.

시장 반응 및 영향

딥시크(DeepSeek) 3.1 버전 발표는 금융 시장에 격렬한 반응을 불러일으켰습니다. 엔비디아는 시가총액이 6천억 달러 이상 감소하며 미국 증시 역사상 최대 규모의 손실을 기록했습니다. 다른 AI 하드웨어 기업들의 주가도 상당한 하락세를 보였습니다.

투자자와 분석가들은 AI 산업에 대한 평가를 재고하고 있습니다. 최첨단 AI를 위해서는 막대한 하드웨어 투자와 독자적인 개발이 필수적이라는 기존의 가정이 딥시크(DeepSeek)의 성공으로 인해 도전을 받고 있습니다.

서구 기업들은 이미 딥시크(DeepSeek) 모델을 자사 워크플로우에 적용하여 테스트하고 있습니다. 대표적인 사례로 머크(Merck)는 최고 데이터 책임자가 딥시크를 내부 프로세스에 통합한 여러 AI 옵션 중 하나로 공개적으로 시연했습니다.

향후 발전 방향 및 전망

DeepSeek은 버전 3.1을 AI의 "에이전트 시대"로 가는 첫걸음으로 제시합니다. 이 모델은 도구 활용도 향상 및 다단계 에이전트 작업에 특화되어 있습니다. 학습 후 최적화를 통해 외부 도구 사용 및 복잡한 검색 작업에서 상당한 성능 향상을 이루었습니다.

DeepSeek의 개발 속도를 보면 OpenAI의 차기 R2 버전보다 먼저 V4 모델이 출시될 가능성이 있습니다. 이러한 추세는 기존 AI 산업의 개발 주기를 가속화하고 업데이트 빈도에 대한 새로운 기준을 제시할 수 있습니다.

딥시크의 성공은 이미 전 세계의 다른 중국 AI 기업과 연구자들에게 영감을 주고 있습니다. 오픈 소스 모델은 독점 솔루션에 대한 유효한 대안으로 점점 더 인식되고 있으며, 이는 더욱 다양하고 경쟁력 있는 AI 환경을 조성할 수 있습니다.

도전과 비판

딥시크는 인상적인 성과를 거두었음에도 불구하고 비판도 받고 있습니다. 다른 중국 AI 모델들과 마찬가지로 딥시크는 특정 검열 조치의 적용을 받는데, 이러한 조치는 정치적으로 민감한 주제에 적용될 수 있습니다. 하지만 이러한 제한은 기술적 조정을 통해 우회될 수 있는 경우가 많습니다.

심층탐지 모델의 빠른 발전과 저렴한 가격은 비즈니스 모델의 지속 가능성에 대한 우려를 불러일으킵니다. 비평가들은 극도로 낮은 가격이 장기적으로 유지될 수 있을지, 아니면 전략적인 시장 침투 전략의 일환인지에 대해 의문을 제기합니다.

인공지능 산업에 미치는 글로벌 영향

DeepSeek V3.1은 전 세계 AI 개발에 있어 중요한 전환점을 마련했습니다. 이 모델은 혁신적인 소프트웨어 접근 방식과 효율적인 자원 활용이 막대한 자본 투자와 최신 하드웨어 확보보다 훨씬 중요할 수 있음을 입증했습니다. 이러한 발견은 모든 주요 AI 기업의 전략에 영향을 미칠 것입니다.

오픈소스 모델을 통한 첨단 AI 기술의 민주화는 전 세계적으로 AI 역량의 보다 균등한 분배로 이어질 수 있습니다. 높은 비용이나 기술적 장벽으로 인해 접근이 제한되었던 국가와 기업들도 최첨단 기술에 접근할 수 있게 될 것입니다.

동시에, 딥시크의 성공은 기술 제재 및 수출 통제의 효과성에 의문을 제기합니다. 제한된 자원으로 세계적 수준의 성능을 달성한 딥시크의 사례는 다른 국가들이 유사한 접근 방식을 추구하고 자체적인 AI 생태계를 구축하도록 장려할 수 있습니다.

DeepSeek V3.1은 단순한 AI 모델을 넘어 AI 개발, 자금 조달, 배포 방식의 근본적인 변화를 상징합니다. 기술 혁신, 비용 효율적인 개발, 오픈 소스 공개라는 세 가지 요소가 결합되어 새로운 기회를 창출하는 동시에 기존 시장 선도 기업들에게 심각한 도전을 제기합니다. 앞으로의 발전 과정을 통해 이러한 접근 방식이 AI 산업의 미래를 어떻게 바꿔놓을지 지켜볼 필요가 있습니다.

컨설팅, 기획, 실행, 프로젝트 관리 등 모든 서비스를 제공합니다