Піктограма веб -сайту Xpert.digital

Google Gemini KI з реалізацією відео-аналізу та ділянкою екрана-мобільного Всесвітнього конгресу (MWC) 2025

Google Gemini KI з реалізацією відео-аналізу та ділянкою екрана-мобільного Всесвітнього конгресу (MWC) 2025

Google Gemini KI з реалізацією відео-аналізу та ділянкою екрана-мобільного конгресу (MWC) 2025-image: xpert.digital

Мультимодальна взаємодія: Майбутнє помічника Google AI

Нові функції AI: Що означає Boosti Boost для користувачів

На мобільному Всесвітньому конгресі (MWC) 2025 в Барселоні Google представив значні розширення для свого помічника AI Gemini, що повинно покращити досвід користувачів за допомогою нових візуальних функцій. Основні реконструкції включають в себе аналіз відео -аналізу та навички обміну екраном, які будуть доступні для абонентів у планах Google One AI Premium наприкінці березня. Ці розробки відзначають важливу віху в стратегії Google щодо інтеграції штучного інтелекту глибше у повсякденне життя та вдосконалення мультимодальної взаємодії

Підходить для цього:

Нові візуальні функції для Близнюків

Аналіз відео -аналізу в прямому ефірі

Однією з видатних нововведень, представлених на MWC 2025, є функція відео в прямому ефірі для Близнюків. Ця технологія дозволяє користувачам показати AI в режимі реального часу, що фіксує ваша камера смартфона та вести природний діалог. Функція була вперше у травні 2024 року на конференції Google вводу/виводу і тепер готова до вступу. У демонстраційному відео, показаному Google, ви можете побачити, як Поттер фокусується на колекції керамічної роботи та запитує Близнюків про поради щодо вибору кольорів для її наступної вази. Асистент AI аналізує існуючі кольори та дає обґрунтовану рекомендацію щодо відповідної глазурі.

Ця функція використовує багатомодальні навички Близнюків для обробки візуальної інформації в режимі реального часу та для інтерпретації в контексті природної розмови. Він є частиною більшого проекту Google, який відомий як "Project Astra", і являє собою значний прогрес у розробці помічників ШІ, які можуть взаємодіяти з реальним світом.

Функціональність обміну екраном

Друга важлива візуальна розширення - це функція обміну екраном, яка дозволяє користувачам ділитися екраном смартфона з Gemini. Під час запуску інтерфейсу Gemini на Android з’являється нова кнопка з написом "поділитися екраном з Live", через яку користувач може поділитися своїм екраном у режимі реального часу з помічником AI. Ця функція доповнюється новим сповіщенням у стилі телефонного дзвінка, що дозволяє безперешкодно інтегрувати в інтерфейс користувача.

У практичних сценаріях застосування Близнюки можуть допомогти, наприклад, за допомогою інтернет -покупок. У прикладі демонстрації Google показує, як користувач може запитати Близнюків, що б добре відповідав джинсам, відображеним на екрані. Потім Близнюки можуть дати рекомендації на основі того, що він бачить, та супроводжувати користувача через процес покупки.

Технічні деталі та доступність

Графік для вступу

Google планує розгорнути нові функції обміну відео та екраном для передплатників Gemini Advanced у березні 2025 року. Ці функції пропонуються в рамках плану преміум -класу Google One, який коштує 21,99 євро на місяць. По -перше, розширення будуть доступні лише для пристроїв Android, при цьому пристрої Pixel та Samsung, зокрема, є одними з перших, які були підтримуються.

Інтеграція в Gemini Live

Нові візуальні функції інтегруються в Gemini Live, Assistant Assistant Google, що дозволяє в режимі реального часу. Gemini Live був оновлений за допомогою Gemini 2.0 Flash, версією мультимодальної моделі, яка була спеціально оптимізована для швидкого мобільного використання. Цікаво, що випуск екрану підтримується новим повідомленням у стилі телефонного дзвінка, яке повинно забезпечити безперебійну інтеграцію в досвід користувачів.

Технологічна основа

Нові функції базуються на проекті Astra, проекту Google для універсального мультимодального помічника AI. Метою цього проекту є розробка помічника, який може обробляти текстові, відео та аудіо в режимі реального часу та зберегти в контексті розмови до десяти хвилин. Ця технологія також повинна мати можливість використовувати пошук Google, об'єктив та карти, щоб запропонувати всебічний досвід асистента.

Підходить для цього:

Близнюки в контексті ринку AI Assistant

Конкурентна позиція

З новими візуальними функціями, Google стратегічно позиціонує себе проти свого основного конкурента OpenAI та його чату. Розширений голосовий режим від Chatgpt підтримує обмін наживом та екраном з грудня 2024 року. Інтегруючи ці функції в Gemini Live, Google гарантує, що його помічник AI залишається конкурентоспроможним та пропонує порівнянні навички.

Значення для індустрії смартфонів

Впровадження вдосконалених функцій AI, таких як Близнюки, які могли б мати важливий вплив на індустрію смартфонів. Після двох років зменшення показників продажів, в яких багато споживачів довше тримали свої пристрої, інтеграція помічників ШІ може створити нові стимули для купівлі з розширеними навичками. У Німеччині, за даними Bitkom, лише на кожній третині є пристрій, який молодший року - у 2023 році він був ще 55 відсотків.

Виробники смартфонів використовують нові функції AI як функцію диференціації, оскільки пристрої дуже схожі на зовнішній та технологічно. Наприклад, Samsung показує, як агент може робити завдання щодо декількох додатків на новому смартфоні S25, тоді як OPPO демонструє візуальні навички штучного інтелекту для обробки зображень.

Більше оновлень для Близнюків

Розширена підтримка мови

На додаток до візуальних функцій, Google також розширив мовні навички Близнюка. Асистент AI тепер може зрозуміти та говорити на 45 мовах. Особливо інноваційною функцією є здатність змінювати мову в середині речення, не змінюючи мовні налаштування вашого телефону - "Gemini Live зрозуміє та відповість".

Нові віджети для користувачів iPhone

Хоча візуальні функції спочатку доступні лише для пристроїв Android, Google також оголосив оновлення для користувачів iPhone. З версією 1.2025.0762303 додатка Gemini, представлено шість різних віджетів блокування екрану, які дозволяють швидше отримати доступ до помічника AI. Ці віджети включають параметри, такі як "Enter", "Поговоріть з Gemini Live", "Відкрийте мікрофон", "Використовуйте камеру", "Поділитися зображення" та "Share File". Вони можуть бути розміщені як на блоковному екрані, так і в центрі управління iPhone, що полегшує доступ до Близнюків.

Ця розробка розглядається деякими спостерігачами як спроба заманити користувачів iPhone та iPad від голосового помічника Apple Siri. Як повідомляється, Apple повільно прогресує в розробці більш потужної версії Siri, яка може конкурувати з провідними платформами AI.

Висновок: Значення та світогляд

Оновлення Близнюків, представлених Google на MWC 2025, позначають важливий крок в еволюції помічників ШІ. Нові візуальні функції Live-аналіз та обмін екраном підлягають більш інтуїтивно зрозумілому та контекстному взаємодії між користувачами та штучним інтелектом. Вони є частиною більш широкого розвитку для мультимодальних помічників, які можуть все більше взаємодіяти з реальним світом.

Інтеграція цих функцій може мати далекосяжний вплив на різні області. Для індустрії смартфонів ви можете створити нові стимули для покупки та допомогти відновити застійний ринок. Для користувачів вони відкривають нові можливості використовувати AI у повсякденному житті, будь то під час покупок, творчих проектів або пошуку інформації.

У той же час, ці події ілюструють поточну конкуренцію між великими технологічними компаніями в галузі АІ -помічників. Google, OpenAI, Apple та інші постійно працюють над вдосконаленням своїх помічників та оснащенні їх новими функціями. Це сприяє інноваціям і може призвести до ще потужніших та інтуїтивних помічників AI у найближчі роки.

З проектом Astra та новими функціями для Gemini, Google показує своє довгострокове бачення для помічників AI: вони повинні бути універсальними, мультимодальними та глибоко в повсякденному житті. Оновлення, представлені на MWC 2025, є важливим кроком таким чином і дають зрозуміти майбутнє взаємодії людини-машини.

Підходить для цього:

 

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑ Наша ділова мова - англійська чи німецька

☑ Нове: листування на вашій національній мові!

 

Конрад Вольфенштейн

Я радий бути доступним вам та моїй команді як особистого консультанта.

Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн xpert.digital

Я з нетерпінням чекаю нашого спільного проекту.

 

 

☑ Підтримка МСП у стратегії, порадах, плануванні та впровадженні

☑ Створення або перестановка цифрової стратегії та оцифрування

☑ Розширення та оптимізація міжнародних процесів продажів

☑ Глобальні та цифрові торгові платформи B2B

☑ Піонерський розвиток бізнесу / маркетинг / PR / Мір

Залиште мобільну версію