⭐️ Штучний інтелект (ШІ) - Блог про ШІ, гаряча точка та центр контенту ⭐️ Цифровий інтелект ⭐️ Преса - Xpert Зв'язки з пресою | Консалтинг та послуги ⭐️ XPaper

Доступно 27 мовами 📢

Віддавайте перевагу Xpert.Digital у Googleⓘ

Штучний інтелект Google Gemini з аналітикою відео в реальному часі та функцією спільного використання екрана – Всесвітній мобільний конгрес (MWC) 2025

Опубліковано: 4 березня 2025 р. / Оновлено: 4 березня 2025 р. – Автор: Konrad Wolfenstein

Штучний інтелект Google Gemini з аналітикою відео в реальному часі та функцією спільного використання екрана – Всесвітній мобільний конгрес (MWC) 2025 – Зображення: Xpert.Digital

Мультимодальна взаємодія: майбутнє помічника Google AI

Нові функції штучного інтелекту: що означає Gemini Boost для користувачів

На Всесвітньому мобільному конгресі (MWC) 2025 у Барселоні компанія Google представила значні покращення для свого помічника зі штучним інтелектом Gemini, розроблені для покращення взаємодії з користувачем завдяки новим візуальним функціям. Основні доповнення включають аналітику відео в реальному часі та можливості спільного використання екрана, які будуть доступні передплатникам преміум-тарифу Google One AI наприкінці березня. Ці розробки знаменують собою важливу віху в стратегії Google щодо глибшої інтеграції штучного інтелекту в повсякденне життя та покращення мультимодальної взаємодії між користувачами та цифровими помічниками

Пов'язано з цим:

Штучний інтелект та смартфони на базі штучного інтелекту: Samsung Galaxy AI на Всесвітньому мобільному конгресі в Барселоні

Нові візуальні можливості для Gemini

Аналіз відео в реальному часі

Однією з видатних інновацій, представлених Google на MWC 2025, є функція живого відео для Gemini. Ця технологія дозволяє користувачам показувати штучному інтелекту в режимі реального часу, що знімає камера їхнього смартфона, та брати участь у природному діалозі. Вперше про це повідомили на конференції Google I/O у травні 2024 року, і тепер ця функція готова до запуску. У демонстраційному відео, показаному Google, гончар наводить свою камеру на колекцію керамічних виробів і просить у Gemini поради щодо вибору кольорів для своєї наступної вази. Помічник на основі штучного інтелекту аналізує доступні кольори та надає обґрунтовану рекомендацію щодо відповідної глазурі.

Ця функція використовує мультимодальні можливості Gemini для обробки візуальної інформації в режимі реального часу та інтерпретації її в контексті природної розмови. Вона є частиною більшого проєкту Google, відомого як «Проєкт Astra», і являє собою значний прогрес у розвитку асистентів на базі штучного інтелекту, здатних взаємодіяти з реальним світом.

Функція спільного доступу до екрана

Другим важливим візуальним покращенням є функція спільного використання екрана, яка дозволяє користувачам ділитися екраном свого смартфона з Gemini. Коли інтерфейс Gemini запускається на Android, з'являється нова кнопка з написом «Поділитися екраном з Live», яка дозволяє користувачам ділитися своїм екраном з помічником зі штучним інтелектом у режимі реального часу. Ця функція доповнюється новим сповіщенням у стилі телефонного дзвінка, що забезпечує безшовну інтеграцію в інтерфейс користувача.

У практичних сценаріях застосування Gemini може використовувати цю функцію, наприклад, для допомоги в онлайн-шопінгу. У демонстрації Google показує, як користувач може запитати у Gemini, що добре пасуватиме до пари джинсів, відображених на екрані. На основі побаченого Gemini може надати рекомендації та провести користувача через процес покупки.

Технічні деталі та доступність

Графік вступу

Google планує запровадити нові функції прямих трансляцій та спільного перегляду екрана для передплатників Gemini Advanced вже у березні 2025 року. Ці функції пропонуватимуться в рамках плану Google One AI Premium, який коштує 21,99 євро на місяць. Спочатку покращення будуть доступні лише для пристроїв Android, а пристрої Pixel та Samsung будуть одними з перших, які будуть підтримуватися.

Інтеграція в Gemini Live

Нові візуальні функції інтегровані в Gemini Live, безперервного помічника Google на базі штучного інтелекту, який дозволяє вести розмови в режимі реального часу. Gemini Live оновлено за допомогою Gemini 2.0 Flash, версії мультимодальної моделі, спеціально оптимізованої для швидкого мобільного використання. Цікаво, що спільний доступ до екрана підтримується новим сповіщенням, стилізованим під телефонний дзвінок, що забезпечує безперешкодну інтеграцію в користувацький інтерфейс.

Технологічна основа

Нові функції базуються на Project Astra, ініціативі Google щодо створення універсального, мультимодального помічника на базі штучного інтелекту. Метою цього проекту є розробка помічника, який може обробляти текстові, відео- та аудіодані в режимі реального часу та зберігати їх у розмовному контексті тривалістю до десяти хвилин. Ця технологія також призначена для використання Пошуку Google, Lens та Карт для забезпечення комплексного досвіду роботи з помічником.

Пов'язано з цим:

Персональний помічник Google зі штучним інтелектом: існує дві версії – Gemini (стандартна версія) та Gemini Advanced (платна преміум-версія)

Gemini в контексті ринку асистентів зі штучним інтелектом

Конкурентне позиціонування

Завдяки цим новим візуальним функціям Google стратегічно позиціонує себе порівняно зі своїм головним конкурентом, OpenAI, та його ChatGPT. Розширений голосовий режим ChatGPT підтримує прямий ефір та спільний доступ до екрана з грудня 2024 року. Інтегруючи ці функції в Gemini Live, Google гарантує, що його помічник зі штучним інтелектом залишається конкурентоспроможним та пропонує порівнянні можливості.

Значення для індустрії смартфонів

Впровадження передових функцій штучного інтелекту, подібних до тих, що пропонує Gemini, може суттєво вплинути на індустрію смартфонів. Після двох років зниження продажів, протягом яких багато споживачів довше користувалися своїми пристроями, інтеграція помічників на основі штучного інтелекту з розширеними можливостями може створити нові стимули для покупок. У Німеччині, згідно з опитуванням Bitkom, лише кожна третя людина зараз володіє пристроєм віком менше року – порівняно з 55 відсотками у 2023 році.

Виробники смартфонів використовують нові функції штучного інтелекту як фактор диференціації, оскільки пристрої дуже схожі за зовнішнім виглядом та технологіями. Наприклад, Samsung демонструє, як агент на своєму новому смартфоні S25 може виконувати завдання в кількох програмах, тоді як Oppo демонструє візуальні можливості штучного інтелекту для обробки зображень.

Більше оновлень для Gemini

Розширена мовна підтримка

Окрім візуальних функцій, Google також розширив мовні можливості Gemini. Помічник зі штучним інтелектом тепер може розуміти та розмовляти 45 мовами. Однією з особливо інноваційних функцій є його здатність перемикатися між мовами посеред речення, без необхідності змінювати мовні налаштування телефону – «Gemini Live зрозуміє та відповість».

Нові віджети для користувачів iPhone

Хоча візуальні функції спочатку будуть доступні лише для пристроїв Android, Google також анонсувала оновлення для користувачів iPhone. Версія 1.2025.0762303 програми Gemini представляє шість різних віджетів екрана блокування, які забезпечують швидший доступ до помічника зі штучним інтелектом. Ці віджети включають такі опції, як «Запит на введення», «Поговорити з Gemini в прямому ефірі», «Відкрити мікрофон», «Використати камеру», «Поділитися зображенням» та «Поділитися файлом». Їх можна розмістити як на екрані блокування, так і в Центрі керування iPhone, що полегшує доступ до Gemini.

Деякі спостерігачі інтерпретують цей розвиток подій як спробу відвернути користувачів iPhone та iPad від голосового помічника Apple Siri. Звіти свідчать про те, що Apple повільно розвиває потужнішу версію Siri, яка може конкурувати з провідними платформами штучного інтелекту.

Висновок: Значення та перспективи

Оновлення для Gemini, представлені Google на MWC 2025, знаменують собою значний крок в еволюції асистентів на базі штучного інтелекту. Нові візуальні функції – аналіз відео в реальному часі та спільний доступ до екрана – забезпечують більш інтуїтивну та контекстно-залежну взаємодію між користувачами та штучним інтелектом. Вони є частиною ширшого розвитку мультимодальних асистентів, які можуть все більше взаємодіяти з реальним світом.

Інтеграція цих функцій може мати далекосяжні наслідки для різних секторів. Для індустрії смартфонів вони можуть створити нові стимули для покупок та допомогти оживити стагнаційний ринок. Для користувачів вони відкривають нові можливості використання штучного інтелекту в повсякденному житті, чи то для покупок, творчих проектів чи пошуку інформації.

Водночас, ці розробки підкреслюють постійну конкуренцію між великими технологічними компаніями у сфері асистентів на основі штучного інтелекту. Google, OpenAI, Apple та інші постійно працюють над удосконаленням своїх асистентів та оснащенням їх новими функціями. Це стимулює інновації та може призвести до появи ще потужніших та інтуїтивно зрозумілих асистентів на основі штучного інтелекту в найближчі роки.

За допомогою проекту Astra та нових функцій для Gemini, Google демонструє своє довгострокове бачення щодо асистентів на базі штучного інтелекту: вони мають бути універсальними, мультимодальними та глибоко інтегрованими в повсякденне життя. Оновлення, представлені на MWC 2025, є важливим кроком у цьому напрямку та пропонують зазирнути в майбутнє взаємодії людини та машини.

Пов'язано з цим:

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑️ Наша ділова мова – англійська або німецька

☑️ НОВИНКА: Листування вашою рідною мовою!

Konrad Wolfenstein

Я та моя команда раді бути вашим особистим консультантом.

Ви можете зв'язатися зі мною, заповнивши контактну форму тут [email protected]:, або просто зателефонувавши мені за номером +49 7348 4088 965. Моя адреса електронної пошти

Я з нетерпінням чекаю нашого спільного проєкту.