公開:2025年3月18日 /更新:2025年3月18日 - 著者: Konrad Wolfenstein
Google AIモデルのアップグレード:New Gemini 2.0-Deep Research 2.0、Flash 2.0、Flash Thinking 2.0およびPro 2.0(実験)-Image:Xpert.Digital
新たに考えた理由:ジェミニ2.0はAIを次の段階に持ち上げます
ジェミニディープリサーチ2.0
Gemini Deep Research 2.0は、2025年3月13日以来、世界中のすべてのユーザーがアクセスできます。この日、GoogleはDeep Researchの幅広い利用可能性を発表しました。これは、改良されたGemini 2.0 Flash Thinking Experimental Modelと連携しています。
Gemini Deep Research 2.0の可用性のための重要なポイント:
- これで、有料のサブスクリプションなしでは、45を超える言語で無料で使用できます。
- すべてのGeminiユーザーは、月に数回無料で深い研究を使用できます。
- Gemini Advancedユーザーは、この関数への無制限のアクセスを引き続き持っています。
- Deep Researchのモバイル版は、2025年2月18日にAndroidおよびiOSデバイスのために導入されました。
この拡張により、Google Deep Researchはより広範なユーザーベースにアクセスできるようになり、AIがサポートする研究ツールの民主化に向けて重要な一歩を踏み出しました。
に適し:
Gemini 2.0フラッシュ思考:AIの研究とパーソナライズの開発
GoogleのAIアシスタントGeminiでの最近の開発の飛躍は、3つのコア領域で大幅な改善をもたらします。すべてのユーザーの深い研究、拡張されたパーソナライゼーション機能、2.0フラッシュ思考を通じてより強力な再発です。これらの革新は、AIアシスタントと対話し、複雑な研究タスクを管理する方法を変えます。
深い研究:すべての人のためのAIベースの研究
Deep Researchは、もともとGemini Advanced Subscribers向けの排他的な機能でしたが、45を超える言語のすべてのユーザーが無料で利用できるようになりました。この強力な機能により、ジェミニは複雑なトピックを独立して研究し、結果を明確で詳細なレポートにまとめた個人的な研究助手に変換します。
Gemini 1.5 Proから2.0フラッシュ思考まで
決定的な改善は、Gemini 1.5 Proの新しい2.0フラッシュ思考実験モデルへの転換です。このシステムは、洗練されたメモリアルステップのチェーンを使用して、複雑な問題を管理可能な中間ステップに分解します。これにより、計画から検索、分析、レポートまで、すべてのフェーズでの研究スキルが大幅に向上します。
研究プロセスの詳細
ディープリサーチは、最初に検索クエリをパーソナライズされたマルチステージの研究計画に変換します。ユーザーによるこの計画の承認後、システムはWebを自律的に検索し、関連情報を収集し始めます。プロセス全体を通して、ジェミニは人と同様の方法で研究することにより、分析を継続的に改良します。興味深い情報を見つけてから、これらの調査結果に基づいて新しい検索を開始します。
深い研究の特別な点は、思考プロセスの透明性です。ユーザーはシステムの考慮事項を理解し、必要に応じて介入することができます。最終結果は、主要な知識と元のソースへのリンクを備えた包括的なレポートであり、数分で作成され、数時間の手動調査を置き換えます。
パーソナライズの増加:ジェミニは個々のニーズを理解しています
2番目の重要なイノベーションは、実験的なパーソナライズ機能であり、GeminiはGoogleアプリやサービスの個人データに基づいて回答を適応させることができます。
Googleエコシステムとの統合
ユーザーの同意を得て、Geminiはテーラーメイドの回答を提供するために、検索履歴やその他のGoogleサービスにアクセスできます。システムはこのデータを使用して、ユーザーのアクティビティと好みをよりよく理解し、より関連性の高いコンテンツを提供します。
パーソナライズは、Google Search-Geminiの統合から始まり、以前の検索クエリに基づいて推奨事項を提供できます。近い将来、このシステムは、Google PhotosやYouTubeなどの他のサービスからコンテキストを引き出すこともできます。これにより、さらに包括的なパーソナライズが可能になります。
データの保護と制御
Googleは、ユーザーデータの責任ある取り扱いを強調しています。Geminiは、この情報が有用であると考えられている場合にのみ検索コースにアクセスします。この機能はオプションであり、対応するリンクを備えたバナーを介していつでも無効化できます。このパーソナライゼーション機能は、最初はWeb上のGeminiおよびGemini Advancedユーザーが利用できるようになり、すぐにモバイルデバイスに拡大します。
2.0フラッシュ思考:透明思考プロセス
これらのイノベーションの中心は、2.0 Flash Thinking Experimental Modelです。これは、効率と速度が向上していると確信しており、すべてのユーザーが利用できるようになりました。
目に見える思考による透明性
2.0フラッシュ思考の優れた特性の1つは、思考プロセスを開示する能力です。このモデルは、AIN関数をより深く理解できるようにするため、回答ウィンドウの「思考/思考」としての考慮事項を示しています。この「推論」アプローチとは、出力の前に回答が数回チェックされることを意味し、より正確で信頼できる結果につながります。
パフォーマンスと範囲
更新されたモデルは、印象的な技術的改善を提供します。
- 広範なテキストの分析を可能にするGemini Advancedユーザー向けの100万のトークンを備えたコンテキストウィンドウ
- ファイルアップロードのサポート
- 数学と科学のベンチマークのパフォーマンスの向上
- 思考と答えの間のより良い一貫性
アプリやサービスとの統合
重要な拡張機能は、Gmail、Googleカレンダー、ドライブ、メッセージ、YouTubeなどのサービスへのアクセスを可能にするGeminiアプリ(以前は拡張機能と呼ばれていた)とのリンクです。この統合により、モデルが全体的なコンテキストを記録し、タスクを個々のステップに分解し、継続的に進捗を評価する複雑でマルチステップの問い合わせが可能になります。
今後数週間で、「写真を尋ねる」機能を提供するGoogle Photosアプリも利用可能になります。たとえば、旅行の写真を分析して旅行スケジュールを作成したり、画像に関する特定の情報を求めたりすることができます。
AIアシスタントの新しい章
すべてのユーザー向けのディープリサーチの導入は、拡張パーソナライゼーション機能と強力な2.0フラッシュ思考モデルと組み合わされており、AIアシスタントの開発において大きな進歩を示しています。 Googleは競争の責任者に位置し、より多くの聴衆が高度なAI機能にアクセスできるようにします。
これらの革新は、ジェミニをシンプルなチャットボットから、複雑な研究タスクを管理し、個々のニーズを理解し、思考を透明にすることができる強力なパーソナルアシスタントに変えます。 Googleエコシステムとパーソナライズの増加を統合することにより、Geminiはますますユーザーの自然な拡大になりつつあり、そのニーズを予測し、本当にテーラメイドのサポートを提供します。
に適し:
Gemini 2.0:以前のバージョンと比較したGoogle KIのさらなる開発
Gemini 2.0の導入により、GoogleはAIモデルファミリを大幅に開発しました。新世代は、以前のバージョンに速度、精度、機能の大幅な改善をもたらします。 Gemini 2.0の最も重要な違いと革新は、以前のバージョンと比較して詳細に分析されています。
パフォーマンスの改善と主な違い
Gemini 2.0は、彼の前任者からのいくつかの基本的な改善によって解決されています。最も顕著な変化は速度の向上です。Gemini2.0フラッシュは、Gemini 1.5 Proの約2倍の速さであり、多数のベンチマークでそれを超えています。この速度の増加は、さまざまなタスクの精度が大幅に向上すると、手をつないで行きます。
複雑なタスクの精度も大幅に増加しました。たとえば、Gemini 2.0は、ポッドキャストと詳細な転写の場合、精度が向上したことを示しています。さらに、このモデルはより微妙なコンテキスト関連のエディションを生成し、創造的なコンテンツの作成と複雑な問題ソリューションのためのより価値のあるツールになります。
もう1つの重要な革新は、拡張されたマルチモーダルスキルの導入です。 Geminiはすでに1.5のマルチモーダル関数を提供していましたが、Gemini 2.0はテキスト、画像、オーディオ、ビデオデータを処理するだけでなく、より深い分析と理解もできます。
Gemini 2.0のモデルバリアント
GoogleはさまざまなバリエーションでGemini 2.0を導入しており、それぞれが特定のアプリケーションに最適化されています。
ジェミニ2.0フラッシュ
基本モデルは一般的に利用可能になり、より高いレートの制限とパフォーマンスの向上を提供します。開発者にとって理想的であり、オーディオ、画像、ビデオ、テキストデータで効率的に作業できます。このモデルは、100万トークンのコンテキストウィンドウをサポートしています。
実験あたりのジェミニ2.0
これは、複雑なタスクとコーディングの最も強力なモデルです。フラッシュバリアントと同じくらい200万トークンツワイツの拡張コンテキストウィンドウがあります。内部ベンチマークでは、Gemini 2.0 Proはほとんどすべての領域で最高の結果を達成します。
ジェミニ2.0フラッシュライト
Gemini 1.5 Flashと比較して、パフォーマンスが改善されている、新しい安価なバリアント。重要なパフォーマンス損失を受け入れることなく、コスト効率の高いソリューションを探している開発者にとって特に興味深いです。
ジェミニ2.0フラッシュ思考実験
この実験モデルは、Openaai O3とDeepSeek-R1と同様に、回答生成の前に追加の思考プロセスを使用しています。また、YouTube、マップ、Google検索などの外部ツールにアクセスすることもできます。
拡張された技術スキル
マルチモーダル処理
Gemini 2.0のマルチモーダルスキルは、以前のバージョンよりもはるかに成熟しています。モデルは、テキスト、画像、オーディオデータを処理および生成することもできます。この機能により、医療診断などのより複雑なアプリケーションが可能になり、書かれた患者レポートやイメージング手順を分析およびリンクできます。
自律エージェントとツールの使用
Gemini 2.0は、意思決定と計画行動を行うことで独立してタスクを実行できる自律エージェントの概念を紹介します。 Gemini 2.0 Flashでは、マルチモーダルライブAPIとネイティブツールの使用が特に注目に値し、モデルがアクセスして外部ツールに使用できるようにします。
コンテキストウィンドウとトークン処理
重要な技術的な違いは、コンテキストウィンドウのサイズです。
- Gemini 2.0フラッシュとフラッシュライト:入力用の100万トークン
- ジェミニ2.0あたり:入力用の200万トークン
- すべてのモデル:出力用の8,192トークン
それに比べて、2時間のビデオ、19時間のオーディオ、60,000本のコードラインを備えたコードベース、または2,000本のテキストサイトを含む、データの量ごとにGemini 1.5が処理できました。
比較してベンチマークの結果
ベンチマークでは、Gemini 2.0が以前のバージョンと比較して大幅な改善を示しています。
数学的タスクでは、数学ベンチマークで91.8%あたりGemini 2.0、Hiddenmathで65.2%がフラッシュバリアントよりも大幅に多く達成されます。 Openais SimpleQa-Testでは、Proモデルは44.3%に達し、Gemini 2.0フラッシュは29.9%になります。
この改善は、複雑な含有量の分析にも明らかです。画像を分析するとき、Gemini 2.0は、たとえば、古いバージョンと比較してより深い分析と実用的なソリューションを提供します。
統合と可用性
すべてのGemini 2.0モデルは、Google AI StudioおよびVertex AI、およびGoogleのプレミアムチャットボットGemini Advancedを介してデスクトップおよびモバイルデバイスで利用できます。 Google Search、Maps、WorkspaceなどのGoogleサービスとの統合の改善により、ユーザーエクスペリエンスが均一になります。
新しい機能は開発者にもアクセスでき、GoogleはAPIの価格設定により柔軟になります。たとえば、短いコンテキストと長いコンテキストの問い合わせの以前の区別はキャンセルされました。これにより、Gemini 1.5 Flashのパフォーマンスの改善にもかかわらず、混合ワークロード(テキストと画像)のコストを保持できます。
今後の展開
Gemini 2.0はすでに大きな進歩を示していますが、発表された機能はまだ利用できないことに注意する必要があります。このようにして、今後数か月以内に、Image and Audio Edition、およびLive VideoがFlash and Proでフォローする必要があります。さらに、フラッグシップモデル「Gemini 2.0 Ultra」はまだ発表されていません。
マルチモーダル、高速、インテリジェント:ジェミニ2.0をユニークにしている理由
Gemini 2.0は、前任者のバージョンと比較して、進化の重要な飛躍を表しています。自律剤の統合とネイティブツールの使用は、AIシステムがますます独立して知的に作用できるパラダイムシフトを示しています。
に適し:
あなたのグローバルマーケティングおよびビジネス開発パートナー
☑️ 私たちのビジネス言語は英語またはドイツ語です
☑️ NEW: 母国語での通信!
喜んで個人アドバイザーとしてあなたと私のチームにお役に立ちたいと思っています。
お問い合わせフォームにご記入 +49 89 89 674 804 (ミュンヘン)までお電話ください。私のメールアドレスは: wolfenstein ∂ xpert.digital
私たちの共同プロジェクトを楽しみにしています。