
Google Gemini AI с аналитикой видео в реальном времени и функцией демонстрации экрана – Mobile World Congress (MWC) 2025 – Изображение: Xpert.Digital
Мультимодальное взаимодействие: будущее Google AI Assistant
Новые функции ИИ: что означает Gemini Boost для пользователей
На выставке Mobile World Congress (MWC) 2025 в Барселоне Google представила значительные улучшения для своего ИИ-помощника Gemini, призванные повысить удобство использования благодаря новым визуальным функциям. Основные нововведения включают аналитику видео в реальном времени и возможности демонстрации экрана, которые станут доступны подписчикам премиум-плана Google One AI в конце марта. Эти разработки знаменуют собой важный этап в стратегии Google по более глубокой интеграции искусственного интеллекта в повседневную жизнь и улучшению мультимодального взаимодействия между пользователями и цифровыми помощниками
В связи с этим:
- Искусственный интеллект и смартфоны с поддержкой ИИ: Samsung Galaxy AI на выставке Mobile World Congress в Барселоне
Новые визуальные функции для Gemini
Анализ видео в реальном времени
Одной из самых ярких инноваций, представленных Google на MWC 2025, стала функция видео в реальном времени для Gemini. Эта технология позволяет пользователям в режиме реального времени показывать ИИ то, что снимает камера их смартфона, и вступать с ним в естественный диалог. Впервые анонсированная на конференции Google I/O в мае 2024 года, эта функция теперь готова к запуску. В демонстрационном видеоролике, показанном Google, гончар направляет камеру на коллекцию керамических изделий и просит Gemini дать совет по выбору цветов для своей следующей вазы. ИИ-помощник анализирует доступные цвета и дает обоснованную рекомендацию по подходящей глазури.
Эта функция использует мультимодальные возможности Gemini для обработки визуальной информации в реальном времени и ее интерпретации в контексте естественного разговора. Она является частью более масштабного проекта Google, известного как «Проект Астра», и представляет собой значительный шаг вперед в разработке ИИ-помощников, способных взаимодействовать с реальным миром.
функция совместного использования экрана
Второе важное визуальное улучшение — это функция демонстрации экрана, которая позволяет пользователям делиться экраном своего смартфона с Gemini. При запуске интерфейса Gemini на Android появляется новая кнопка с надписью «Поделиться экраном с Live», позволяющая пользователям делиться своим экраном с ИИ-помощником в режиме реального времени. Эта функция дополняется новым уведомлением, оформленным как телефонный звонок, что обеспечивает бесшовную интеграцию в пользовательский интерфейс.
В практических сценариях Gemini может использовать эту функцию, например, для помощи в онлайн-покупках. В демонстрации Google показывает, как пользователь может спросить у Gemini, что хорошо сочетается с парой джинсов, отображаемых на экране. На основе увиденного Gemini может дать рекомендации и помочь пользователю в процессе покупки.
Технические характеристики и доступность
Хронология внедрения
Google планирует внедрить новые функции прямой видеотрансляции и демонстрации экрана для подписчиков Gemini Advanced уже в марте 2025 года. Эти функции будут доступны в рамках тарифного плана Google One AI Premium, стоимость которого составляет 21,99 евро в месяц. Первоначально улучшения будут доступны только для устройств Android, при этом устройства Pixel и Samsung будут одними из первых, которые получат поддержку.
Интеграция в Gemini Live
Новые визуальные функции интегрированы в Gemini Live, постоянно работающего ИИ-помощника от Google, который обеспечивает общение в режиме реального времени. Gemini Live был обновлен до версии Gemini 2.0 Flash, версии многомодальной модели, специально оптимизированной для быстрого использования на мобильных устройствах. Интересно, что функция демонстрации экрана поддерживается новым уведомлением, оформленным как телефонный звонок, что обеспечивает бесшовную интеграцию в пользовательский интерфейс.
Технологическая основа
Новые функции основаны на проекте Astra, инициативе Google по созданию универсального многомодального ИИ-помощника. Цель этого проекта — разработка помощника, способного обрабатывать текстовые, видео- и аудиоданные в режиме реального времени и сохранять их в контексте диалога продолжительностью до десяти минут. Эта технология также призвана использовать возможности Google Поиска, Lens и Картов для обеспечения всестороннего взаимодействия с помощником.
В связи с этим:
- Персональный ИИ-помощник Google: существует две версии – Gemini (стандартная версия) и Gemini Advanced (платная премиум-версия)
Gemini в контексте рынка ИИ-помощников
Конкурентное позиционирование
Благодаря этим новым визуальным функциям Google стратегически позиционирует себя по отношению к своему главному конкуренту, OpenAI, и его ChatGPT. Расширенный голосовой режим ChatGPT поддерживает демонстрацию экрана и работу в режиме реального времени с декабря 2024 года. Интегрируя эти функции в Gemini Live, Google гарантирует, что его ИИ-помощник останется конкурентоспособным и предложит сопоставимые возможности.
Значение для индустрии смартфонов
Внедрение передовых функций искусственного интеллекта, подобных тем, что предлагает Gemini, может оказать значительное влияние на индустрию смартфонов. После двух лет снижения продаж, в течение которых многие потребители дольше пользовались своими устройствами, интеграция ИИ-помощников с расширенными возможностями может создать новые стимулы для покупки. В Германии, согласно опросу Bitkom, только каждый третий человек сейчас владеет устройством моложе года — по сравнению с 55 процентами в 2023 году.
Производители смартфонов используют новые функции искусственного интеллекта в качестве отличительного фактора, поскольку устройства очень похожи по внешнему виду и технологиям. Например, Samsung демонстрирует, как агент на новом смартфоне S25 может выполнять задачи в нескольких приложениях, а Oppo показывает визуальные возможности искусственного интеллекта для обработки изображений.
Дополнительные новости для Близнецов
Расширенная языковая поддержка
В дополнение к визуальным функциям, Google также расширила языковые возможности Gemini. Теперь ИИ-помощник может понимать и говорить на 45 языках. Особенно инновационной функцией является возможность переключения языка посреди предложения без необходимости изменения языковых настроек телефона — «Gemini Live поймет и ответит».
Новые виджеты для пользователей iPhone
Хотя визуальные функции изначально будут доступны только для устройств Android, Google также анонсировала обновления для пользователей iPhone. В версии 1.2025.0762303 приложения Gemini представлены шесть различных виджетов для экрана блокировки, которые обеспечивают более быстрый доступ к ИИ-помощнику. Эти виджеты включают такие опции, как «Ввести подсказку», «Поговорить с Gemini в прямом эфире», «Открыть микрофон», «Использовать камеру», «Поделиться изображением» и «Поделиться файлом». Их можно разместить как на экране блокировки, так и в Центре управления iPhone, что упрощает доступ к Gemini.
Некоторые наблюдатели интерпретируют это как попытку переманить пользователей iPhone и iPad от голосового помощника Apple, Siri. Сообщения указывают на то, что Apple медленно продвигается в разработке более мощной версии Siri, способной конкурировать с ведущими платформами искусственного интеллекта.
Заключение: Значение и перспективы
Обновления для Gemini, представленные Google на MWC 2025, знаменуют собой значительный шаг в эволюции ИИ-помощников. Новые визуальные функции — анализ видео в реальном времени и демонстрация экрана — обеспечивают более интуитивное и контекстно-ориентированное взаимодействие между пользователями и искусственным интеллектом. Они являются частью более широкого развития в направлении мультимодальных помощников, способных все больше взаимодействовать с реальным миром.
Интеграция этих функций может иметь далеко идущие последствия для различных секторов. Для индустрии смартфонов это может создать новые стимулы для покупок и помочь оживить застойный рынок. Для пользователей это открывает новые возможности для использования ИИ в повседневной жизни, будь то покупки, творческие проекты или поиск информации.
В то же время эти события подчеркивают продолжающуюся конкуренцию между крупными технологическими компаниями в области ИИ-помощников. Google, OpenAI, Apple и другие постоянно работают над улучшением своих помощников и наделением их новыми функциями. Это стимулирует инновации и может привести к появлению еще более мощных и интуитивно понятных ИИ-помощников в ближайшие годы.
В рамках проекта Astra и новых функций Gemini компания Google демонстрирует свое долгосрочное видение ИИ-помощников: они должны быть универсальными, мультимодальными и глубоко интегрированными в повседневную жизнь. Обновления, представленные на MWC 2025, являются важным шагом в этом направлении и позволяют заглянуть в будущее взаимодействия человека и машины.
В связи с этим:
Ваш глобальный партнер по маркетингу и развитию бизнеса
☑️ Язык ведения нашего бизнеса — английский или немецкий
☑️ НОВИНКА: Переписка на вашем родном языке!
Я и моя команда будем рады быть вашими личными консультантами.
Вы можете связаться со мной, заполнив контактную форму здесь wolfenstein@xpert.digital:или просто позвонив по номеру +49 7348 4088 965. Мой адрес электронной почты
Я с нетерпением жду начала нашего совместного проекта.

