Deepseek V3：印象的なAIパフォーマンスを備えた改善されたAIモデルは、ベンチマークのトップモデルを超えています

公開：2025年3月26日 /更新：2025年3月26日 - 著者： Konrad Wolfenstein

Deepseek V3は、推論とプログラミングを改善します

オープンソースKIの未来：DeepseekがV3アップデートを公開します

2025年3月25日、Deepseekは、DeepSeek-V3-0324と呼ばれるV3言語モデルの重要な更新をリリースしました。この新しいバージョンは、推論、プログラミング、フロントエンド開発などの分野の大幅な改善を示しています。印象的なベンチマークの結果と強力な消費者ハードウェアで実行される可能性により、DeepSeek-V3-0324は、独自のソリューションに挑戦する主要なオープンソースAIモデルとしての地位を占めています。

に適し：

Openaaiの主要なAIモデルの比較分析：GoogleGemini 2.0、Deepseek R2、GPT-4.5

技術的基盤と建築

主要な技術としての専門家の混合

Deepseek V3-0324は、他の多くのAIモデルと区別する革新的な混合物（MOE）アーキテクチャに基づいています。このアーキテクチャにより、システムは各タスクのモデルのすべての部分をアクティブにするのではなく、それぞれのリクエストに必要な特定のコンポーネントのみを使用できます。これは、問題を解決するために適切な専門家のみが使用される専門家のチームのように機能します。

現在のモデルには合計6,850億パラメーターがあり、そのうち各タスクに対して約370億のみがアクティブになっています。この選択的アクティベーションにより、より効率的な処理が可能になり、リソース要件が大幅に削減されます。

パフォーマンスを向上させるための革新的なテクニック

DeepSeek-V3-0324は、パフォーマンスを向上させる2つの中心的な技術革新を導入します。

マルチヘッド潜在注意（MLA）：このテクノロジーは、キー値キャッシュを潜在ベクトルに圧縮し、長いテキストの処理を最適化し、メモリ要件を大幅に削減します。
マルチトークン予測（MTP）：いくつかのトークンの同時生成を有効にします。これにより、出力速度が最大80％増加します。
さらに、DeepSeekはV3混合精度の算術を使用します。このことで、潤滑剤コンバイトメティクスは、同じ操作で異なる長さと精度の数で実行されます。精度の低下は、結果の品質に大きな影響を与えることなく時間を増やします。

パフォーマンスの改善とベンチマークの結果

さまざまな分野での大きな進歩

DeepSeek-V3-0324は、いくつかの重要な分野での前任者と比較して、顕著な改善を示しています。

推論機能 - ベンチマークの結果は、特に複雑なタスクで大幅な増加を示します。
- MMLU-Pro：75.9から81.2（+5.3ポイント）
- GPQA：59.1から68.4（+9.3ポイント）
- AIME（American Invitational Mathematics Examination）：39.6から59.4（+19.8ポイント）
- LiveCodeBech：39.2から49.2（+10.0ポイント）
フロントエンド開発：実行可能なコードと審美的に魅力的なWebサイトとゲームフロントエンドを作成するためのスキルの向上。
中国語のスキル：中から長期のテキスト、最適化された翻訳品質、レターレターのスタイルと品質の向上を伴うライティングスキルの向上。

AIコンペティションへのポジショニング

DeepSeek-V3-0324は、人工分析のインテリジェンスインデックスにおける最高評価の非読み取りモデルです。 Gemini 2.0 Pro、Claude 3.7 Sonnet、Llama 3.3 70bを含むすべての独自の非読み取りモデルを上回ります。 Intelligence Indexでは、Deepseek独自のR1モデルやOpenaai、Anthropic、Alibabaのその他の推論モデルのすぐ後ろにランク付けされています。

Dropなどのテストでは、Deepseekは印象的な91.6％を達成しましたが、GPT-4oは83.7％、Claude 3.5 88.3％に達しました。これらの結果は、主要な独自のソリューションと比較して、モデルの競争力を強調しています。

効率とアクセシビリティ

リソースの最適化とハードウェアの要件

DeepSeek-V3-0324の最も注目すべき特性の1つは、その効率です。 MOEアーキテクチャやその他の最適化を通じて、このモデルは、M3ウルトラチップを備えたMac Studioなどの強力な消費者デバイスで操作できます。

モデルの4ビットバージョンは、約352 GBのストレージスペースしか必要とし、従来のAIシステムよりも重要に少ない際に200ワット未満を消費します。この効率は、AIインフラストラクチャの要件を再定義する可能性があります。

オープンライセンスと可用性

OpenaaiやAnthropicなどの西洋の競合他社とは対照的に、有料APIを介してモデルのみを提供し、DeepSeek-V3-0324が共同ライセンスの下で公開されました。これにより、制限なしに無料の使用および商用インサートが可能になります。

モデルはさまざまなプラットフォームで利用できます。

DeepSeekアプリを介して
公式ウェブサイトで
プログラミングインターフェイス（API）を介して
独自のコンピューターへのインストールとして
Microsoft Azure Cloudについて

に適し：

Economic Turbo Deepseek：経済エンジンとしての中国の新しいAIの希望？

企業の歴史とビジョン

金融の世界からAI研究まで

Deepseekは2023年4月にLiang Wenfengによって設立されました。Liang Wenfengは2015年にHeggink Heg-Flyerを設立しました。ヘッジファンドは、数学とAIが支援する貿易戦略に特化しており、後のAI開発のために基礎を築きました。

同社は、ハイテクチップスから中国への米国によって課された輸出禁止の背景に反して設立されました。 Deepseekは、西部AIソリューションに強力で競争力のある代替品を提供し、同時に中国の技術的主権を強化するという戦略的目標を追求しています。

開放性の哲学

Liang Wenfengによると、同社の調査結果とモデルは、企業文化の一部であるオープンソースライセンスの下で常に公開されています。この開放性は、制限的なライセンスによって特徴付けられる多数の独自のAIシステムとは対照的です。

「私たちは、ハードワークの成功の99％と才能から生じるのは1％だけだと固く信じています」と、同社はそのウェブサイトでその哲学を説明しています。

見通しと将来の開発

新しいモデルの基礎

DeepSeek-V3-0324は、R2と呼ばれる新しい推論モデルの基礎として機能する可能性があり、その公開は今後数週間で予想されます。現在のR1モデルは、問題解決スキルを通じてすでに注目を集めていました。

DeepSeekモデルの継続的なさらなる開発は、ダイナミックロードマップを示しています。これには、DeepSeekエコシステムにおけるマルチモーダルサポートやその他の将来指向の機能も含まれる場合があります。

AIの民主化：DeepSeek-V3-0324が新しい基準を設定する方法

DeepSeek-V3-0324は、大きな音声モデルの開発における大きな進歩を表しています。革新的なアーキテクチャ、印象的なパフォーマンス、オープンライセンスを通じて、確立された独自モデルに挑戦し、AIテクノロジーの民主化を推進することができます。

技術の革新、効率、アクセシビリティの組み合わせにより、DeepSeek-V3-0324はAI景観の重要なマイルストーンになります。消費者ハードウェアで実行する能力と、推論、プログラミング、フロントエンド開発などの分野でのスキルの向上により、DeepSeekはOpenaai、Google、Anthropicなどの大手AI企業の真剣な競合他社としての地位を獲得しています。

に適し：