公開:2025年6月18日 /更新:2025年6月18日 - 著者: Konrad Wolfenstein
Googleの新しいAIは「Deep Think Deep」ができるようになりました。ただの答え以上のもの - より速く、より賢く、より賢く、これまで以上に人間的に聞こえる - 画像:Xpert.Digital
Gemini 2.5はGoogleをAIマーケットリーダーにします:これがユーザーにとって何を意味しますか
Googleは新しいGemini-2.5モデルを導入し、アクセスを拡大します
GoogleはGemini-2.5モデルの大幅な進歩を発表し、最も高度なAIテクノロジーへのアクセスを大幅に拡大しました。最新の開発は、GoogleのAI戦略における重要なマイルストーンであり、人工知能の分野の大手プロバイダーとして会社を位置付けています。
に適し:
Gemini 2.5 Flash and Proの一般的な可用性
2025年6月17日、GoogleはGemini 2.5 FlashとProの安定したバージョンをリリースしました。これらのモデルはテスト段階ではなくなり、生産的なアプリケーションで自信を持って使用できます。開発者と企業は、Google AI StudioおよびVertex AIを介してモデルを使用できますが、Geminiアプリでも入手できます。
一般的な可用性は、Googleが長期的にこれらのモデルをサポートし、スケーリングされた生産アプリケーションに適していることを意味します。 Spline、Rooms、Snap、SmartBearなどの企業は、過去数週間で最新のバージョンとうまく連携してきました。
ジェミニ2.5フラッシュライトの紹介
Gemini-2.5ファミリーへの最新の追加として、Google Gemini 2.5 Flash-Liteは、2.5シリーズで費用対効果の高い最速モデルを紹介しました。 Flash-Liteは最初はプレビューとして利用でき、翻訳や分類などの大量のタスクを実行する必要がある開発者を対象としています。
この新しいモデルは、プログラミング、数学、自然科学、論理的思考、マルチモーダルベンチマークの分野でGemini 2.0フラッシュライトよりも大幅に優れた品質を提供します。それはフル価格モデルのコストのほんの一部を引き起こし、前任者よりも低い遅延時間を提供します。
拡張された思考スキルと深い考え方
Gemini-2.5モデルの重要な機能は、高度な「思考」スキルです。これらの思考モデルは、答えの前に自分の考えを考えることができ、パフォーマンスの向上とより高い精度につながります。 「予算を考える」ことで、開発者は、回答を生成する前に、モデルがどのように検討すべきかを確認できます。
Googleは、Gemini 2.5 Proの実験的な「Deep Think」モードも発表しました。このモードにより、モデルは、回答がある前にいくつかの考え方を並行して追求できます。これは、複雑な数学的およびプログラミングタスクに特に有利です。テストでは、Deep Thinkは米国の数学オリンピック2025で最高のパフォーマンスを達成し、要求の厳しいMMMUベンチマークで84%を達成しました。
新しい機能と改善
ネイティブオーディオ出力とライブAPI
Gemini 2.5は、より自然な会話を可能にするネイティブのオーディオ出力関数を受信します。拡張ライブAPIは、視聴覚エントリをサポートし、AIとの直接会話を可能にします。ユーザーは、トーン、アクセント、表現を制御し、たとえば、モデルに劇的なトーンでストーリーを読むべきだと言っています。
新しい実験機能には次のものが含まれます。
- 感情的な対話:モデルは声の感情を認識し、それに応じて答えます
- プロアクティブオーディオ:バックグラウンドトークの自動フィルタリング
- テキストツーチー:24を超える言語で複数のスピーカーをサポートします
プログラミングスキルの向上
Gemini 2.5 ProはWebDev Arenaランキングをリードしており、Web開発の大幅な改善を示しています。このモデルは、エージェントベースのコード評価の産業標準であるSWEベンチ検証で63.8%に達します。視覚的に魅力的なWebアプリとエージェントベースのコードアプリケーション、およびコード変換と処理を作成するときに優れています。
ビデオMMベンチマークは、印象的なマルチモーダルスキルを示しています。Gemini2.5Proは、Gemini 1.5で75%、GPT-4oで71.9%に比べて84.8%に達します。この機能により、ビデオコンテンツからアプリケーション全体を作成できます。
拡張されたマルチモダリティとコンテキスト処理
Gemini 2.5は、Geminiモデルの強度に基づいて構築されています。ネイティブマルチモダリティと大きなコンテキストウィンドウ。このモデルは、100万のトークンコンテキストウィンドウから始まり、200万トークンがまもなく利用可能になります。広範なデータレコードを理解し、テキスト、オーディオ、画像、ビデオ、コードリポジトリ全体など、さまざまな情報ソースから複雑な問題を編集することができます。
可用性とアクセス
開発者向け
- Google AI Studio:実験の即時可用性
- Vertex AI:機能を備えた企業が利用できます
- Gemini API:SDKサポートとの完全な統合
エンドユーザー向け
- Geminiアプリ:デスクトップとモバイルでGemini上級ユーザーが利用できます
- Google検索:Flash-LiteとFlashの特別に適合したバージョン
教育部門
Googleは、ブラジル、インドネシア、日本、イギリスの学生向けのGoogle AI Pro-Planへの無料アクセスを2026年最終試験に拡張します。AIサポートに加えて、パッケージには2つのTBストレージスペースとNoteBookKLMも含まれています。
に適し:
技術仕様とパフォーマンス
Gemini 2.5 Proは、Lmarenaランキングを明確な距離でリードし、さまざまなベンチマークで州のサービスを示しています。このモデルは、「人類の最後の試験」で18.8%に達します。これは、知識と論理的思考の人間の限界を把握するために、数百人の専門家によって開発されたデータセットです。
Gemini 2.5 Proの最新バージョンは、Lmarenaでの24ポイントのELOジャンプとWebdevaraの35ポイントELOジャンプを示しています。 Aider PolyGlotなどの困難なプログラミングベンチマークに引き続きつながり、GPQAやその他の厳しい数学的および科学的レビューのトップパフォーマンスを示しています。
Google Gemini 2.5フラッシュとPer Per AIランドスケープを安定したバージョンで変換する
Gemini 2.5 FlashとProの安定したバージョンの導入とFlash-Liteのプレビューは、GoogleのAI開発における重要なステップです。パフォーマンスの向上、機能の拡張、幅広いアクセスの組み合わせにより、Googleは人工知能の分野の大手プロバイダーとしての地位を確立しています。
継続的な改善と可用性の拡大は、開発者、企業、エンドユーザーにとってAIテクノロジーをよりアクセスしやすく効率的にするというGoogleのコミットメントを示しています。新しい思考スキルとマルチモダリティの改善により、Gemini 2.5は次世代のAIアプリケーションの新しい基準を設定しています。
に適し:
あなたのグローバルマーケティングおよびビジネス開発パートナー
☑️ 私たちのビジネス言語は英語またはドイツ語です
☑️ NEW: 母国語での通信!
喜んで個人アドバイザーとしてあなたと私のチームにお役に立ちたいと思っています。
お問い合わせフォームにご記入 +49 89 89 674 804 (ミュンヘン)までお電話ください。私のメールアドレスは: wolfenstein ∂ xpert.digital
私たちの共同プロジェクトを楽しみにしています。