Ikona webové stránky Xpert.Digital

Google Gemini Ki s analýzou živého videa a funkcí sdílení obrazovky-mobile světového kongresu (MWC) 2025

Google Gemini Ki s analýzou živého videa a funkcí sdílení obrazovky-mobile světového kongresu (MWC) 2025

Google Gemini Ki s analýzou živého videa a funkce sdílení obrazovky-mobile světový kongres (MWC) 2025-image: xpert.digital

Multimodální interakce: Budoucnost asistenta Google AI

Nové funkce AI: Co pro uživatele znamená Boost Blíženci

Na Mobile World Congress (MWC) 2025 v Barceloně představil Google významná rozšíření pro svého asistenta AI Gemini, což by mělo zlepšit uživatelský zážitek prostřednictvím nových vizuálních funkcí. Mezi hlavní renovace patří dovednosti živého videa a dovednosti sdílení obrazovky, které budou k dispozici pro předplatitele společnosti Google One Premium Plán na konci března. Tento vývoj znamená důležitý milník ve strategii společnosti Google pro integraci umělé inteligence hlouběji do každodenního života a zlepšení multimodální interakce

Vhodné pro:

Nové vizuální funkce pro Blíženci

Živá analýza videa

Jednou z nevyřízených inovací prezentovaných na MWC 2025 je funkce Live Video pro Gemini. Tato technologie umožňuje uživatelům ukázat AI v reálném čase, co váš smartphone kamera zachycuje, a vést přirozený dialog. Funkce byla poprvé v květnu 2024 na konferenci Google I/O a je nyní připravena na úvod. V demonstračním videu zobrazeném společností Google můžete vidět, jak se Potter zaměřuje na sbírku keramické práce a zeptá se Gemini na radu ohledně výběru barev pro její další vázu. Asistent AI analyzuje stávající barvy a poskytuje opodstatněné doporučení pro vhodnou glazuru.

Tato funkce využívá multimodální dovednosti Gemini ke zpracování vizuálních informací v reálném čase a k interpretaci v souvislosti s přirozenou konverzací. Je součástí většího projektu Google, který je známý jako „Project Astra“, a představuje významný pokrok ve vývoji asistentů AI, kteří mohou interagovat se skutečným světem.

Funkce sdílení obrazovky

Druhou důležitou vizuální rozšíření je funkce sdílení obrazovky, která uživatelům umožňuje sdílet obrazovku smartphonu s Gemini. Při spuštění rozhraní Gemini na Androidu se objeví nové tlačítko s nápisem „Sdílet obrazovky s Live“, prostřednictvím kterého může uživatel sdílet svou obrazovku v reálném čase s asistentem AI. Tato funkce je doplněna novým oznámením ve stylu telefonního hovoru, který umožňuje bezproblémovou integraci do uživatelského rozhraní.

V praktických aplikačních scénářích může Gemini například pomoci s online nakupováním. V příkladu demonstrace Google ukazuje, jak se uživatel může zeptat Gemini, co by se dobře zapadalo do džíny zobrazených na obrazovce. Gemini pak mohou poskytnout doporučení na základě toho, co vidí, a doprovázet uživatele v procesu nákupu.

Technické údaje a dostupnost

Časový rozvrh pro úvod

Google plánuje zavedení nových funkcí sdílení živého videa a obrazovky pro pokročilé předplatitele Gemini v březnu 2025. Tyto funkce jsou nabízeny jako součást plánu Google One AI Premium, který stojí 21,99 EUR za měsíc. Za prvé, rozšíření budou k dispozici pouze pro zařízení Android, přičemž zařízení Pixel a Samsung jsou zejména mezi prvními, které budou podporovány.

Integrace v Gemini Live

Nové vizuální funkce jsou integrovány do Gemini Live, Continuous AI Assistant Google, který umožňuje rozhovory v reálném čase. Gemini Live byl aktualizován pomocí Gemini 2.0 Flash, verze multimodálního modelu, který byl speciálně optimalizován pro rychlé a mobilní použití. Zajímavé je, že vydání obrazovky je podporováno novým oznámením ve stylu telefonního hovoru, který by měl umožnit bezproblémovou integraci do uživatelského prostředí.

Technologický základ

Nové funkce jsou založeny na projektu Astra, projektu Google pro univerzálního multimodálního asistenta AI. Cílem tohoto projektu je vyvinout asistenta, který dokáže zpracovat textová, video a zvuková data v reálném čase a ušetřit v konverzaci konverzace až deset minut. Tato technologie by měla být také schopna používat vyhledávání, objektivy a mapy Google k nabídce komplexního asistenta.

Vhodné pro:

Blíženci v souvislosti s asistentem AI

Konkurenční pozice

S novými vizuálními funkcemi se Google strategicky postaví proti svému hlavnímu konkurentovi OpenAI a jeho chatu. Pokročilý hlasový režim z ChatGPT podporuje živé a sdílení obrazovky od prosince 2024. Integrace těchto funkcí v Gemini Live Google zajišťuje, že jeho asistent AI zůstává konkurenceschopný a nabízí srovnatelné dovednosti.

Význam pro průmysl smartphonů

Zavedení pokročilých funkcí AI, jako jsou Gemini, které by mohly mít důležitý dopad na odvětví smartphonů. Po dvou letech klesajících údajů o prodeji, ve kterých mnoho spotřebitelů udržovalo svá zařízení déle, by integrace asistentů AI mohla vytvořit nové nákupní pobídky s rozšířenými dovednostmi. V Německu má podle Bitkomu pouze každá třetina zařízení, které je mladší než rok - v roce 2023 to bylo ještě 55 procent.

Výrobci smartphonů používají nové funkce AI jako funkci diferenciace, protože zařízení jsou velmi podobná na vnější straně a technologicky. Například Samsung ukazuje, jak může agent provádět úkoly v několika aplikacích na novém smartphonu S25, zatímco OPPO demonstruje vizuální dovednosti umělé inteligence pro zpracování obrazu.

Další aktualizace pro Gemini

Rozšířená podpora jazyka

Kromě vizuálních funkcí Google také rozšířil jazykové dovednosti Gemini. Asistent AI nyní může rozumět a mluvit ve 45 jazycích. Obzvláště inovativní funkcí je schopnost změnit jazyk uprostřed věty, aniž byste museli měnit jazykové nastavení telefonu - „Gemini Live pochopí a odpoví“.

Nové widgety pro uživatele iPhone

Přestože jsou vizuální funkce zpočátku k dispozici pouze pro zařízení Android, Google také oznámil aktualizace pro uživatele iPhone. S verzí 1.2025.0762303 aplikace Gemini se představí šest různých widgetů zámku, které umožňují rychlejší přístup k asistentovi AI. Tyto widgety zahrnují možnosti jako „Enter“, „Promluvte si s Gemini Live“, „Otevřít mikrofon“, „Použít kameru“, „Sdílet obrázek“ a „Sdílet soubor“. Mohou být umístěny na obrazovce zámku i do řídicího centra iPhone, což usnadňuje přístup k Gemini.

Tento vývoj jsou některými pozorovateli vnímáni jako pokus o nalákání uživatelů iPhone a iPadu z hlasového asistenta Apple Siri. Apple údajně pomalu postupuje ve vývoji silnější verze Siri, která může konkurovat předních platformách AI.

Závěr: Význam a výhled

Aktualizace pro Gemini představené společností Google na MWC 2025 označují důležitý krok ve vývoji asistentů AI. Nová vizuální funkce videa pro život a více intuitivnější a kontextovou interakci mezi uživateli a umělou inteligencí. Jsou součástí širšího vývoje vůči multimodálním asistentům, kteří mohou stále více interagovat se skutečným světem.

Integrace těchto funkcí by mohla mít daleko -narušující účinky na různé oblasti. Pro odvětví smartphonů byste mohli vytvořit nové pobídky na nákup a pomoci oživit stagnační trh. Pro uživatele otevírají nové příležitosti k používání AI v každodenním životě, ať už při nakupování, kreativních projektech nebo při hledání informací.

Současně tento vývoj ilustruje pokračující konkurenci mezi velkými technologickými společnostmi v oblasti AI asistentů. Google, OpenAI, Apple a další neustále pracují na zlepšení svých asistentů a vybavení je novými funkcemi. To vede inovace a mohlo by to vést k ještě silnějším a intuitivnějším asistentům AI v nadcházejících letech.

S projektem Astra a novými funkcemi pro Gemini ukazuje Google svou dlouhodobou vizi asistentů AI: měly by být univerzální, multimodální a hluboko do každodenního života. Aktualizace prezentované na MWC 2025 jsou tímto způsobem důležitým krokem a poskytují nahlédnutí do budoucnosti interakce lidského stroje.

Vhodné pro:

 

Váš globální partner pro marketing a rozvoj podnikání

☑️ Naším obchodním jazykem je angličtina nebo němčina

☑️ NOVINKA: Korespondence ve vašem národním jazyce!

 

Konrad Wolfenstein

Rád vám a mému týmu posloužím jako osobní poradce.

Kontaktovat mě můžete vyplněním kontaktního formuláře nebo mi jednoduše zavolejte na číslo +49 89 89 674 804 (Mnichov) . Moje e-mailová adresa je: wolfenstein xpert.digital

Těším se na náš společný projekt.

 

 

☑️ Podpora MSP ve strategii, poradenství, plánování a implementaci

☑️ Vytvoření nebo přeladění digitální strategie a digitalizace

☑️ Rozšíření a optimalizace mezinárodních prodejních procesů

☑️ Globální a digitální obchodní platformy B2B

☑️ Pioneer Business Development / Marketing / PR / Veletrhy

Ukončete mobilní verzi