DeepSeek-R1-0528: DeepSeekのアップデートにより、中国のAIモデルは欧米の業界リーダーと同等のレベルに戻る

Konrad Wolfenstein

1年前

DeepSeek-R1-0528：DeepSeekのアップデートにより、中国のAIモデルが欧米の業界リーダーと同等のレベルに復帰 – 画像：Xpert.Digital

オープンソースAIの限界：DeepSeekがOpenAIとGoogleを凌駕する

60位から68位へ：DeepSeekが中国AIを再びトップに押し上げる

中国のAIスタートアップ企業DeepSeekは、2025年5月28日にDeepSeek-R1-0528をリリースし、世界のAI環境を再定義する重要な節目を迎えました。オープンソース推論モデルのアップデートにより、劇的なパフォーマンス向上が実証され、DeepSeekは初めてOpenAIのo3やGoogle Gemini 2.5 Proと同等の性能を実現しました。特に注目すべきは、このピークパフォーマンスがわずかなコストで、完全にオープンなモデル重み付けによって達成されたことです。これは、独自仕様のAIシステムの将来について根本的な疑問を提起しています。独立系評価プラットフォームArtificial Analysisは、この新モデルに68ポイントの評価を与えました。これは、OpenAI o1とo3のパフォーマンス差に相当する、60ポイントから68ポイントへの急上昇です。.

これに関連して:

DeepSeekとAlibaba：専門家レベルでのブレークスルー？ヘルスケア分野における中国のAI推進。

アップデートとその技術的改善

DeepSeek-R1-0528は、アルゴリズムの最適化と学習後の計算リソースの利用率向上により、基盤となるアーキテクチャを変更することなく、大幅なパフォーマンス向上を実現する大幅な機能強化です。このアップデートは主に推論能力の向上に焦点を当てており、DeepSeekによれば「より深い思考プロセス」を可能にします。この改善の特に顕著な例は、AIME 2025数学試験で、正解率が70%から87.5%に向上しました。同時に、1問あたりの平均トークン数は12,000トークンから23,000トークンに増加し、処理能力の向上が示されました。.

推論機能の改善に加え、JSON出力と関数呼び出し、最適化されたユーザーインターフェース、幻覚の軽減など、重要な新機能が導入されています。これらの機能強化により、モデルは開発者にとってより実用的になり、その適用範囲も大幅に拡大します。提供状況は変更ありません。既存のAPIユーザーには自動的にアップデートが提供されますが、モデルの重みはHugging Face上でオープンMITライセンスの下で引き続きご利用いただけます。.

ベンチマークパフォーマンスとパフォーマンス比較

DeepSeek-R1-0528のベンチマーク結果は、全ての評価カテゴリーにおいて目覚ましい向上を示しました。数学タスクでは、AIME-2024のスコアが79.8%から91.4%に、HMMT-2025は41.7%から79.4%に、CNMO-2024は78.8%から86.9%に向上しました。これらの結果により、このモデルは数学的問題解決において世界で最も強力なAIシステムの一つとして位置付けられています。.

DeepSeek-R1-0528は、プログラミングベンチマークにおいても大きな進歩を示しました。LiveCodeBenchは63.5%から73.3%、Aider-Polyglotは53.3%から71.6%、SWE Verifiedは49.2%から57.6%へと向上しました。Codeforcesの評価は1,530ポイントから1,930ポイントへと上昇し、アルゴリズム問題解決ツールとしてトップクラスに位置づけられました。競合モデルと比較すると、DeepSeek-R1はSWE Verifiedで49.2%を達成し、OpenAI o1-1217の48.9%をわずかに上回りました。一方、Codeforcesでは96.3パーセンタイル、Elo評価2,029ポイントと、OpenAIのトップモデルに非常に迫っています。.

一般知識と論理テストでは、幅広いパフォーマンスの向上が確認されました。GPQA-Diamondは71.5%から81.0%、Humanity's Last Examは8.5%から17.7%、MMLU-Proは84.0%から85.0%、MMLU-Reduxは92.9%から93.4%に向上しました。OpenAIのSimpleQAのみが30.1%から27.8%へとわずかに低下しました。これらの包括的な改善は、DeepSeek-R1-0528が専門分野だけでなく、認知タスク全般において競争力があることを示しています。.

技術アーキテクチャとイノベーション

DeepSeek-R1-0528の技術基盤は、洗練されたMoE（Mixture of Experts）アーキテクチャに基づいています。このアーキテクチャは、合計6,710億個のパラメータのうち370億個のアクティブパラメータと12万8,000トークンのコンテキスト長を備えています。このモデルは高度な強化学習を実装し、自己検証、多段階のリフレクション、そして人間のような推論能力を実現しています。このアーキテクチャにより、反復的な思考プロセスを通じて複雑な推論タスクに取り組むことができ、従来の言語モデルとは一線を画しています。.

特に革新的な点は、DeepSeek-R1-0528の思考プロセスを抽出し、学習後のQwen3-8B-Base向けに改良された、蒸留版バリアントであるDeepSeek-R1-0528-Qwen3-8Bの開発です。この小型版は、大幅に低いリソース要件で優れたパフォーマンスを実現し、8～12GBのVRAMを搭載したGPUで動作します。AIME 2024テストでは、このモデルはオープンソースモデルの中で最先端のパフォーマンスを達成し、Qwen3-8Bと比較して10%の向上、Qwen3-235B-Thinkingと同等のパフォーマンスを達成しました。.

開発手法から、DeepSeekは強化学習による事後学習への依存度が高まっていることが示されており、評価期間中のトークン消費量は7,100万トークンから9,900万トークンへと40%増加しました。これは、モデルが根本的なアーキテクチャ変更を必要とせずに、より長く、より深い回答を生成していることを示唆しています。.

市場ポジションと競争動向

DeepSeek-R1-0528は、欧米のテクノロジー企業の主要な独自モデルに対する強力な競合としての地位を確立しつつあります。Artificial Analysisによると、このモデルは68ポイントを獲得し、GoogleのGemini 2.5 Proと同等のスコアを獲得し、xAIのGrok 3 mini、MetaのLlama 4 Maverick、NvidiaのNemotron Ultraといったモデルを上回っています。コードカテゴリでは、DeepSeek-R1-0528はOpenAIのo4-miniとo3にわずかに劣るレベルを達成しています。.

このアップデートのリリースは、世界のAI環境に大きな影響を与えました。2025年1月にDeepSeek-R1が初めてリリースされた際には、既に中国以外のテクノロジー株の急落を招き、AIの拡張には膨大な計算能力と投資が必要であるという前提に疑問を投げかけました。欧米の競合他社は迅速に対応し、GoogleはGeminiのアクセス料金を割引し、OpenAIは価格を値下げし、より少ない計算能力を必要とするo3 Miniモデルを導入しました。.

興味深いことに、EQBenchのテキストスタイル分析によると、DeepSeek-R1のスタイルはOpenAIよりもGoogleの影響を強く受けており、開発にはGeminiの合成出力がより多く使用された可能性を示唆しています。この観察結果は、異なるAI開発者間の複雑な影響と技術移転を浮き彫りにしています。.

コスト効率と可用性

DeepSeek-R1-0528の重要な競争優位性は、その卓越したコスト効率にあります。その価格体系はOpenAIよりも大幅に有利です。入力トークンは、キャッシュヒットで100万トークンあたり0.14ドル、キャッシュミスで0.55ドル、出力トークンは100万トークンあたり2.19ドルです。一方、OpenAI o1は入力トークンが100万トークンあたり15ドル、出力トークンが100万トークンあたり60ドルであるため、DeepSeek-R1は90～95%安価です。.

Microsoft Azureは、DeepSeek-R1を競争力のある価格で提供しています。グローバル版は、入力トークン1,000トークンあたり0.00135ドル、出力トークン1,000トークンあたり0.0054ドルですが、リージョン版は若干高めの価格設定となっています。この価格設定は、独自仕様のソリューションに多額の費用をかけることなく、高品質なAI機能を活用したい企業や開発者にとって、特に魅力的なモデルとなっています。.

MITライセンスに基づくオープンソースモデルとして提供されるため、ライセンス料なしで商用利用および改変が可能です。開発者はモデルをローカルで実行することも、各種API経由で使用することもでき、実装における柔軟性と制御性が向上します。リソースが限られているユーザー向けには、24GBのメモリを搭載したコンシューマー向けハードウェアで動作する、80億パラメータの抽出版もご用意しています。.

これに関連して:

中国の人工知能における追い上げ：ディープシークの事例とデータの戦略的活用

中国のAI追い上げ：DeepSeekの成功が意味するもの

DeepSeek-R1-0528は、世界のAI開発における転換点となり、米国の輸出制限にもかかわらず、中国企業が欧米の優れたシステムに匹敵するモデルを開発できることを証明しました。このアップデートは、学習後の最適化と強化学習を効果的に活用することで、根本的なアーキテクチャの変更なしに大幅なパフォーマンス向上が可能であることを証明しています。最高のパフォーマンス、大幅なコスト削減、そしてオープンソースでの利用可能性の組み合わせは、AI業界の既存のビジネスモデルに根本的な挑戦を投げかけています。.

DeepSeekの成功に対する欧米の競合他社の反応は、すでに市場の変化の初期段階を示しており、OpenAIとGoogleによる価格引き下げ、そしてよりリソース効率の高いモデルの開発が進んでいます。当初2025年5月に予定されていたDeepSeek-R2のリリースが迫っていることから、この競争圧力はさらに強まる可能性があります。DeepSeek-R1-0528の成功事例は、AIにおけるイノベーションは必ずしも莫大な投資や計算リソースを必要とするものではなく、巧妙なアルゴリズムと効率的な開発手法によって実現可能であることを示しています。.

これに関連して:

AI変革、AI統合、AIプラットフォーム業界の専門家

☑️ 当社のビジネス言語は英語またはドイツ語です。

☑️ 新機能: 母国語での対応!

Konrad Wolfenstein

私と私のチームは、あなたの個人アドバイザーとして喜んでお手伝いさせていただきます。.

こちらの問い合わせフォームにご記入いただくか。までお電話ください +49 7348 4088 965 メールアドレスは wolfenstein@xpert.digital。、

私たちの共同プロジェクトを楽しみにしています。.

DeepSeek-R1-0528: DeepSeekのアップデートにより、中国のAIモデルは欧米の業界リーダーと同等のレベルに戻る

オープンソースAIの限界：DeepSeekがOpenAIとGoogleを凌駕する

60位から68位へ：DeepSeekが中国AIを再びトップに押し上げる

アップデートとその技術的改善

ベンチマークパフォーマンスとパフォーマンス比較

技術アーキテクチャとイノベーション

市場ポジションと競争動向

コスト効率と可用性

中国のAI追い上げ：DeepSeekの成功が意味するもの

AI変革、AI統合、AIプラットフォーム業界の専門家

☑️ 当社のビジネス言語は英語またはドイツ語です。

☑️ 新機能: 母国語での対応!

☑️ 戦略、コンサルティング、計画、実装における中小企業のサポート

☑️ AI戦略の策定または再調整

☑️ パイオニア事業開発

オープンソースAIの限界：DeepSeekがOpenAIとGoogleを凌駕する

60位から68位へ：DeepSeekが中国AIを再びトップに押し上げる

アップデートとその技術的改善

ベンチマークパフォーマンスとパフォーマンス比較

技術アーキテクチャとイノベーション

市場ポジションと競争動向

コスト効率と可用性

中国のAI追い上げ：DeepSeekの成功が意味するもの

AI変革、AI統合、AIプラットフォーム業界の専門家

☑️ 当社のビジネス言語は英語またはドイツ語です。

☑️ 新機能: 母国語での対応!

☑️ 戦略、コンサルティング、計画、実装における中小企業のサポート

☑️ AI戦略の策定または再調整

☑️ パイオニア事業開発

その他のトピック