⭐️ Изкуствен интелект (ИИ) - Блог за ИИ, гореща точка и център за съдържание ⭐️ Дигитален интелект ⭐️ Преса - Xpert Връзки с пресата | Консултации и услуги ⭐️ XPaper

Available in 27 languages 📢

Google Gemini AI с анализ на видео на живо и функционалност за споделяне на екрана – Световен мобилен конгрес (MWC 2025)

Публикувано на: 4 март 2025 г. / Актуализирано на: 4 март 2025 г. – Автор: Konrad Wolfenstein

Google Gemini AI с анализ на видео на живо и функционалност за споделяне на екрана – Световен мобилен конгрес (MWC) 2025 – Изображение: Xpert.Digital

Мултимодално взаимодействие: Бъдещето на Google AI Assistant

Нови функции на изкуствения интелект: Какво означава Gemini Boost за потребителите

На Световния мобилен конгрес (MWC) 2025 в Барселона, Google представи значителни подобрения за своя AI асистент Gemini, предназначени да подобрят потребителското изживяване чрез нови визуални функции. Основните допълнения включват анализ на видео на живо и възможности за споделяне на екрана, които ще бъдат достъпни за абонатите на премиум плана Google One AI в края на март. Тези разработки бележат важен етап в стратегията на Google за по-дълбоко интегриране на изкуствения интелект в ежедневието и подобряване на мултимодалното взаимодействие

Свързано с това:

Изкуствен интелект и смартфони, задвижвани от изкуствен интелект: Samsung Galaxy AI на Mobile World Congress в Барселона

Новите визуални функции за Gemini

Анализ на видео на живо

Една от забележителните иновации, които Google представи на MWC 2025, е функцията за видео на живо за Gemini. Тази технология позволява на потребителите да показват на изкуствения интелект в реално време какво заснема камерата на смартфона им и да участват в естествен диалог. За първи път представена на конференцията I/O на Google през май 2024 г., функцията вече е готова за стартиране. В демонстрационно видео, показано от Google, грънчарка насочва камерата си към колекция от керамични изделия и моли Gemini за съвет относно избора на цветове за следващата си ваза. Асистентът с изкуствен интелект анализира наличните цветове и предоставя информирана препоръка за подходяща глазура.

Тази функция използва мултимодалните възможности на Gemini за обработка на визуална информация в реално време и интерпретирането ѝ в контекста на естествен разговор. Тя е част от по-големия проект на Google, известен като „Project Astra“, и представлява значителен напредък в разработването на асистенти с изкуствен интелект, способни да взаимодействат с реалния свят.

Функционалност за споделяне на екрана

Второто важно визуално подобрение е функцията за споделяне на екрана, която позволява на потребителите да споделят екрана на своя смартфон с Gemini. Когато интерфейсът на Gemini се стартира на Android, се появява нов бутон с надпис „Споделяне на екрана с Live“, който позволява на потребителите да споделят екрана си с AI асистента в реално време. Тази функция е допълнена от ново известие, стилизирано като телефонно обаждане, което позволява безпроблемна интеграция в потребителския интерфейс.

В практически сценарии, Gemini може да използва тази функция, за да подпомогне онлайн пазаруването, например. В демонстрация Google показва как потребител може да попита Gemini какво би се съчетало добре с чифт дънки, показани на екрана. Въз основа на това, което вижда, Gemini може да даде препоръки и да насочи потребителя през процеса на пазаруване.

Технически подробности и наличност

Хронология на въвеждането

Google планира да пусне новите функции за видео на живо и споделяне на екрана на абонатите на Gemini Advanced още през март 2025 г. Тези функции ще се предлагат като част от плана Google One AI Premium, който струва 21,99 евро на месец. Първоначално подобренията ще бъдат достъпни само за устройства с Android, като устройствата Pixel и Samsung ще бъдат сред първите, които ще бъдат поддържани.

Интеграция в Gemini Live

Новите визуални функции са интегрирани в Gemini Live, асистентът с изкуствен интелект на Google, който позволява разговори в реално време. Gemini Live е актуализиран с Gemini 2.0 Flash, версия на мултимодалния модел, специално оптимизирана за бърза мобилна употреба. Интересно е, че споделянето на екрана се поддържа от ново известие, стилизирано като телефонно обаждане, което позволява безпроблемна интеграция в потребителското изживяване.

Технологична основа

Новите функции са базирани на Project Astra, инициативата на Google за универсален, мултимодален асистент с изкуствен интелект. Целта на този проект е да се разработи асистент, който може да обработва текстови, видео и аудио данни в реално време и да ги съхранява в разговорен контекст до десет минути. Тази технология е предназначена също така да използва Google Search, Lens и Maps, за да осигури цялостно изживяване при асистента.

Свързано с това:

Личният AI асистент на Google: Има две версии – Gemini (стандартна версия) и Gemini Advanced (платена премиум версия)

Джемини в контекста на пазара на асистенти с изкуствен интелект

Конкурентно позициониране

С тези нови визуални функции, Google стратегически се позиционира спрямо основния си конкурент, OpenAI, и неговия ChatGPT. Разширеният гласов режим на ChatGPT поддържа споделяне на живо и екран от декември 2024 г. Чрез интегрирането на тези функции в Gemini Live, Google гарантира, че неговият AI асистент остава конкурентоспособен и предлага сравними възможности.

Значение за индустрията на смартфоните

Въвеждането на усъвършенствани функции с изкуствен интелект, като тези, предлагани от Gemini, може да окаже значително влияние върху индустрията на смартфоните. След две години на спад в продажбите, през които много потребители задържаха устройствата си по-дълго, интеграцията на асистенти с изкуствен интелект с подобрени възможности може да създаде нови стимули за покупка. В Германия, според проучване на Bitkom, само един на всеки трима души вече притежава устройство на по-малко от година – в сравнение с 55% през 2023 г.

Производителите на смартфони използват новите функции на изкуствения интелект като диференциращ фактор, тъй като устройствата са много сходни по външен вид и технология. Например, Samsung демонстрира как агент на новия си смартфон S25 може да изпълнява задачи в множество приложения, докато Oppo демонстрира визуалните възможности на изкуствения интелект за обработка на изображения.

Още актуализации за Gemini

Подобрена езикова поддръжка

В допълнение към визуалните си функции, Google разшири и езиковите възможности на Gemini. Асистентът с изкуствен интелект вече може да разбира и говори на 45 езика. Една особено иновативна функция е способността му да превключва езиците по средата на изречението, без потребителите да се налага да променят езиковите настройки на телефона си – „Gemini Live ще разбере и ще отговори“.

Нови джаджи за потребители на iPhone

Въпреки че визуалните функции първоначално ще бъдат достъпни само за устройства с Android, Google обяви и актуализации за потребителите на iPhone. Версия 1.2025.0762303 на приложението Gemini въвежда шест различни уиджета за заключен екран, които осигуряват по-бърз достъп до асистента с изкуствен интелект. Тези уиджети включват опции като „Подкана за въвеждане“, „Разговор с Gemini на живо“, „Отваряне на микрофона“, „Използване на камерата“, „Споделяне на изображение“ и „Споделяне на файл“. Те могат да бъдат поставени както на заключения екран, така и на контролния център на iPhone, което улеснява достъпа до Gemini.

Някои наблюдатели интерпретират това развитие като опит да се привлекат потребителите на iPhone и iPad далеч от гласовия асистент на Apple, Siri. Докладите сочат, че Apple напредва бавен начин в разработването на по-мощна версия на Siri, която може да се конкурира с водещите платформи с изкуствен интелект.

Заключение: Значение и перспективи

Актуализациите за Gemini, представени от Google на MWC 2025, бележат значителна стъпка в еволюцията на асистентите с изкуствен интелект. Новите визуални функции – анализ на видео на живо и споделяне на екрана – позволяват по-интуитивно и контекстно-зависимо взаимодействие между потребителите и изкуствения интелект. Те са част от по-широко развитие към мултимодални асистенти, които могат все повече да взаимодействат с реалния свят.

Интегрирането на тези функции може да има широкообхватни последици в различни сектори. За индустрията на смартфоните те биха могли да създадат нови стимули за покупка и да помогнат за съживяване на застоялия пазар. За потребителите те откриват нови възможности за използване на изкуствения интелект в ежедневието, независимо дали става въпрос за пазаруване, творчески проекти или търсене на информация.

В същото време, тези развития подчертават продължаващата конкуренция между големите технологични компании в областта на асистентите с изкуствен интелект. Google, OpenAI, Apple и други непрекъснато работят за подобряване на своите асистенти и за оборудването им с нови функции. Това стимулира иновациите и би могло да доведе до още по-мощни и интуитивни асистенти с изкуствен интелект през следващите години.

С Project Astra и новите функции за Gemini, Google представя дългосрочната си визия за асистентите с изкуствен интелект: те трябва да бъдат универсални, мултимодални и дълбоко интегрирани в ежедневието. Актуализациите, представени на MWC 2025, са важна стъпка в тази посока и предлагат поглед към бъдещето на взаимодействието човек-машина.

Свързано с това:

Вашият глобален партньор по маркетинг и бизнес развитие

☑️ Нашият бизнес език е английски или немски

☑️ НОВО: Кореспонденция на родния ви език!

Konrad Wolfenstein

Аз и моят екип с удоволствие ще бъдем на ваше разположение като ваш личен съветник.

Можете да се свържете с мен, като попълните формата за контакт тук или просто ми се обадите на +49 89 89 674 804 ( Мюнхен) . Моят имейл адрес е: [email protected]

Очаквам с нетърпение нашия съвместен проект.