Опубликовано: 18 июня 2025 г. / Обновление с: 18 июня 2025 г. - Автор: Конрад Вольфенштейн
Новый ИИ Google теперь может «думать глубоко»: больше, чем просто ответы - быстрее, умнее, умнее и звучит более человечно, чем когда -либо - изображение: xpert.digital
Gemini 2.5 делает Google лидером рынка искусственного интеллекта: что это значит для пользователей
Google вводит новую модель Gemini-2,5 и расширяет доступ
Google объявила о значительном прогрессе в своей модели Gemini-2,5 и значительно расширился доступ к самой продвинутой технологии ИИ. Последние разработки отмечают важную веху в стратегии ИИ Google и позиционируют компанию в качестве ведущего поставщика в области искусственного интеллекта.
Подходит для:
Общая доступность Gemini 2.5 Flash и Pro
17 июня 2025 года Google выпустил стабильную версию Gemini 2.5 Flash и Pro для общего использования. Эти модели больше не находятся на фазе испытаний и могут быть уверенно использованы в продуктивных приложениях. Разработчики и компании могут использовать модели через Google AI Studio и Vertex AI, хотя они также доступны в приложении Gemini.
Общая доступность означает, что Google будет поддерживать эти модели в долгосрочной перспективе и что они подходят для масштабированных производственных приложений. Такие компании, как Spline, Rooms, Snap и SmartBear, успешно работали с последними версиями за последние несколько недель.
Введение Gemini 2.5 Flash-Lite
Как последнее дополнение к семейству Gemini-2,5, Google Gemini 2.5 Flash-Lite представила экономически эффективную и быстрая модель в серии 2.5. Flash-Lite изначально доступен в качестве предварительного просмотра и предназначена для разработчиков, которые должны выполнять высокодолувые задачи, такие как переводы и классификации.
Новая модель предлагает значительно лучшее качество, чем Flash-Lite Gemini 2.0 в областях программирования, математики, естественных наук, логического мышления и мультимодальных критериев. Это вызывает лишь часть затрат на модели полной цены и предлагает более низкое время задержки, чем его предшественники.
Расширенные навыки мышления и глубокие размышления
Ключевой особенностью моделей Gemini-2,5 являются их продвинутые навыки «мышления». Эти модели мышления могут продумать свои мысли перед ответом, что приводит к повышению производительности и большей точности. Благодаря «мышлению бюджетов» разработчики могут проверить, насколько интенсивно должна думать модель, прежде чем она генерирует ответ.
Google также объявил об экспериментальном режиме «Глубокий мышление» для Gemini 2.5 Pro. Этот режим позволяет модели выполнять несколько способов мышления параллельно, прежде чем будет ответ, который особенно выгоден для сложных математических и программирующих задач. В тестах, глубокое мышление достигла максимальной производительности в Математической Олимпийских играх США 2025 года и достиг 84% в требованиях MMMU.
Новые функции и улучшения
Нативная аудиовывода и живой API
Gemini 2.5 получает собственные аудио выходные функции, которые обеспечивают более естественные разговоры. Расширенный живой API поддерживает аудиовизуальные записи и позволяет прямые беседы с ИИ. Пользователи могут управлять тоном, акцентом и выражением и, например, сказать модель, которую она должна читать истории драматическим тоном.
Новые экспериментальные функции включают в себя:
- Аффективный диалог: модель распознает эмоции в голосе и ответах соответственно
- Упреждающий звук: автоматическая фильтрация фоновых переговоров
- Текст в речь: поддержка нескольких динамиков на более чем 24 языках
Улучшенные навыки программирования
Gemini 2.5 Pro возглавляет рейтинг WebDev Arena и демонстрирует значительные улучшения в веб -разработке. Модель достигает 63,8% в проверке SWE-Bench, промышленного стандарта для оценки кода на основе агента. Он превосходит при создании визуально привлекательных веб-приложений и приложений кодов на основе агентов, а также преобразования и обработки кода.
Video MM Benchmark показывает впечатляющие мультимодальные навыки: Gemini 2,5 Pro достигает 84,8% по сравнению с 75% в Gemini 1,5 за и 71,9% в GPT-4O. Эта способность позволяет создавать целые приложения из видеоконтента.
Расширенная мультимодальность и обработка контекста
Gemini 2.5 опирается на сильные стороны моделей Близнецов: собственная мультимодальность и большое контекстное окно. Модель начинается с окна контекста токена 1 миллион, в результате чего 2 миллиона токенов будут доступны в ближайшее время. Он может понимать обширные записи данных и редактировать сложные задачи из различных источников информации, включая текст, аудио, изображения, видео и целые кодовые репозитории.
Наличие и доступ
Для разработчиков
- Google AI Studio: немедленная доступность для экспериментов
- Vertex AI: доступно для компаний с расширенными функциями
- API Gemini: Полная интеграция с поддержкой SDK
Для конечных пользователей
- Приложение Gemini: доступно для пользователей Gemini Advanced на рабочем столе и мобильных
- Поиск Google: специально адаптированные версии Flash-Lite и Flash
Сектор образования
Google распространяет бесплатный доступ к Google AI Pro-Plan для студентов в Бразилии, Индонезии, Японии и Великобритании на выпускные экзамены 2026 года. В дополнение к поддержке ИИ, пакет также включает в себя 2 ТБ помещается и Notebookklm.
Подходит для:
Технические характеристики и производительность
Gemini 2.5 Pro возглавляет рейтинг Lmarena на явном расстоянии и показывает государственные службы в различных критериях. Модель достигает 18,8% на «Последнем экзамене человечества», наборе данных, разработанном сотнями экспертов, чтобы понять человеческий предел знаний и логического мышления.
В последней версии Gemini 2.5 Pro показывается 24-очковой прыжок ELO на Lmarena и 35-балльный ELO-прыжок на Webdevara. Это продолжает привести к сложным критериям программирования, таким как Aider PolyGlot, и демонстрирует максимальную производительность в GPQA и другие требовательные математические и научные обзоры.
Google Gemini 2.5 Flash и за преобразование ландшафт ИИ со стабильными версиями
Внедрение стабильных версий Gemini 2.5 Flash и Pro, а также предварительный просмотр Flash-Lite отмечает важный шаг в разработке ИИ Google. Благодаря комбинации улучшенной производительности, расширенных функций и более широкого доступа Google позиционирует себя как ведущий поставщик в области искусственного интеллекта.
Непрерывные улучшения и расширение доступности показывают обязательство Google сделать технологию искусственного интеллекта более доступной и эффективной для разработчиков, компаний и конечных пользователей. С новыми навыками мышления и улучшенной мультимодальностью Gemini 2.5 устанавливает новые стандарты для следующего поколения приложений искусственного интеллекта.
Подходит для:
Ваш глобальный партнер по маркетингу и развитию бизнеса
☑️ Наш деловой язык — английский или немецкий.
☑️ НОВИНКА: Переписка на вашем национальном языке!
Я был бы рад служить вам и моей команде в качестве личного консультанта.
Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein ∂ xpert.digital
Я с нетерпением жду нашего совместного проекта.