Výběr hlasu 📢


Google Gemini Ki s analýzou živého videa a funkcí sdílení obrazovky-mobile světového kongresu (MWC) 2025

Publikováno: 4. března 2025 / Aktualizováno: 4. března 2025 – Autor: Konrad Wolfenstein

Google Gemini Ki s analýzou živého videa a funkcí sdílení obrazovky-mobile světového kongresu (MWC) 2025

Google Gemini AI s analýzou živého videa a funkcí sdílení obrazovky – Mobile World Congress (MWC) 2025 – Obrázek: Xpert.Digital

Multimodální interakce: Budoucnost asistenta Google s umělou inteligencí

Nové funkce umělé inteligence: Co Gemini Boost znamená pro uživatele

Na veletrhu Mobile World Congress (MWC) 2025 v Barceloně společnost Google představila významná vylepšení svého asistenta umělé inteligence Gemini, která mají zlepšit uživatelský zážitek prostřednictvím nových vizuálních funkcí. Mezi hlavní novinky patří analýza živého videa a funkce sdílení obrazovky, které budou pro předplatitele prémiového tarifu Google One s umělou inteligencí k dispozici od konce března. Tato vylepšení představují významný milník ve strategii společnosti Google, jejímž cílem je hlouběji integrovat umělou inteligenci do každodenního života a zlepšit multimodální interakci

Vhodné pro:

Nové vizuální prvky pro Gemini

Analýza živého videa

Jednou z výjimečných inovací, které Google představil na MWC 2025, je funkce živého videa pro Gemini. Tato technologie umožňuje uživatelům v reálném čase ukázat umělé inteligenci, co snímá fotoaparát jejich chytrého telefonu, a zapojit se do přirozeného dialogu. Funkce, která byla poprvé představena na konferenci Google I/O v květnu 2024, je nyní připravena ke spuštění. V demonstračním videu, které Google ukázal, hrnčířka namíří svůj fotoaparát na sbírku keramických kusů a ptá se Gemini na radu s výběrem barev pro svou další vázu. Asistent s umělou inteligencí analyzuje dostupné barvy a poskytuje informované doporučení vhodné glazury.

Tato funkce využívá multimodální schopnosti platformy Gemini ke zpracování vizuálních informací v reálném čase a jejich interpretaci v kontextu přirozené konverzace. Je součástí většího projektu společnosti Google, známého jako „Projekt Astra“, a představuje významný pokrok ve vývoji asistentů s umělou inteligencí schopných interakce s reálným světem.

Funkce sdílení obrazovky

Druhým důležitým vizuálním vylepšením je funkce sdílení obrazovky, která uživatelům umožňuje sdílet obrazovku svého smartphonu s Gemini. Po spuštění rozhraní Gemini na Androidu se objeví nové tlačítko s označením „Sdílet obrazovku s Live“, které uživatelům umožňuje sdílet obrazovku s asistentem s umělou inteligencí v reálném čase. Tuto funkci doplňuje nové oznámení stylizované jako telefonní hovor, což umožňuje bezproblémovou integraci do uživatelského rozhraní.

V praktických aplikacích může Gemini tuto funkci využít například k usnadnění online nakupování. V demonstraci Google ukazuje, jak se uživatel může zeptat Gemini, co by se hodilo k džínám zobrazeným na obrazovce. Na základě toho, co vidí, pak Gemini může poskytnout doporučení a provést uživatele procesem nákupu.

Technické podrobnosti a dostupnost

Časová osa pro úvod

Google plánuje zpřístupnit nové funkce živého videa a sdílení obrazovky předplatitelům Gemini Advanced již v březnu 2025. Tyto funkce budou nabízeny v rámci prémiového tarifu Google One AI, který stojí 21,99 eur měsíčně. Zpočátku budou vylepšení dostupná pouze pro zařízení Android, přičemž mezi prvními, která budou podporována, budou zařízení Pixel a Samsung.

Integrace v Gemini Live

Nové vizuální funkce jsou integrovány do Gemini Live, nepřetržitého asistenta s umělou inteligencí od Googlu, který umožňuje konverzace v reálném čase. Gemini Live byl aktualizován o Gemini 2.0 Flash, verzi multimodálního modelu speciálně optimalizovanou pro rychlé mobilní použití. Zajímavé je, že sdílení obrazovky je podporováno novým oznámením ve stylu telefonního hovoru, což umožňuje bezproblémovou integraci do uživatelského prostředí.

Technologický základ

Nové funkce jsou založeny na projektu Astra, iniciativě společnosti Google pro univerzálního, multimodálního asistenta s umělou inteligencí. Cílem tohoto projektu je vyvinout asistenta, který dokáže v reálném čase zpracovávat textová, obrazová a zvuková data a ukládat je v konverzačním kontextu až do délky deseti minut. Tato technologie má také využívat Vyhledávání Google, Lens a Mapy k poskytování komplexního asistentského zážitku.

Vhodné pro:

Gemini v kontextu trhu s AI asistenty

Konkurenční umístění

Díky těmto novým vizuálním funkcím se Google strategicky staví proti svému hlavnímu konkurentovi, OpenAI, a jeho platformě ChatGPT. Pokročilý hlasový režim ChatGPT podporuje sdílení živého vysílání a obrazovky od prosince 2024. Integrací těchto funkcí do Gemini Live Google zajišťuje, že jeho asistent s umělou inteligencí zůstane konkurenceschopný a nabídne srovnatelné možnosti.

Význam pro odvětví chytrých telefonů

Zavedení pokročilých funkcí umělé inteligence, jako jsou ty, které nabízí Gemini, by mohlo mít významný dopad na odvětví chytrých telefonů. Po dvou letech klesajících prodejů, během nichž si mnoho spotřebitelů svá zařízení ponechalo déle, by integrace asistentů umělé inteligence s rozšířenými funkcemi mohla vytvořit nové pobídky k nákupu. V Německu podle průzkumu společnosti Bitkom nyní pouze každý třetí člověk vlastní zařízení mladší jednoho roku – oproti 55 procentům v roce 2023.

Výrobci chytrých telefonů využívají nové funkce umělé inteligence jako rozlišovací faktor, protože zařízení jsou si vzhledově i technologicky velmi podobná. Například Samsung předvádí, jak může agent na svém novém smartphonu S25 provádět úkoly napříč více aplikacemi, zatímco Oppo předvádí vizuální schopnosti umělé inteligence pro zpracování obrazu.

Další novinky pro Gemini

Vylepšená jazyková podpora

Kromě vizuálních funkcí Google rozšířil i jazykové možnosti Gemini. Asistent s umělou inteligencí nyní rozumí a mluví ve 45 jazycích. Jednou z obzvláště inovativních funkcí je schopnost přepínat jazyky uprostřed věty, aniž by uživatelé museli měnit jazykové nastavení telefonu – „Gemini Live bude rozumět a bude reagovat.“.

Nové widgety pro uživatele iPhonu

Ačkoli vizuální funkce budou zpočátku dostupné pouze pro zařízení Android, Google oznámil aktualizace i pro uživatele iPhonu. Verze 1.2025.0762303 aplikace Gemini představuje šest různých widgetů na zamykací obrazovce, které poskytují rychlejší přístup k asistentovi s umělou inteligencí. Mezi tyto widgety patří možnosti jako „Výzva k zadání textu“, „Mluvit s Gemini Live“, „Otevřít mikrofon“, „Použít kameru“, „Sdílet obrázek“ a „Sdílet soubor“. Lze je umístit jak na zamykací obrazovku, tak i na Ovládací centrum iPhonu, což usnadňuje přístup k Gemini.

Někteří pozorovatelé interpretují tento vývoj jako pokus odlákat uživatele iPhonů a iPadů od hlasové asistentky Siri od Applu. Zprávy naznačují, že Apple pomalu postupuje ve vývoji výkonnější verze Siri, která by mohla konkurovat předním platformám umělé inteligence.

Závěr: Význam a výhled

Aktualizace pro Gemini, které společnost Google představila na veletrhu MWC 2025, představují významný krok ve vývoji asistentů s umělou inteligencí. Nové vizuální funkce – analýza živého videa a sdílení obrazovky – umožňují intuitivnější a kontextově orientovanou interakci mezi uživateli a umělou inteligencí. Jsou součástí širšího vývoje směrem k multimodálním asistentům, kteří mohou stále více interagovat s reálným světem.

Integrace těchto funkcí by mohla mít dalekosáhlé dopady napříč různými odvětvími. Pro odvětví chytrých telefonů by mohly vytvořit nové pobídky k nákupu a pomoci oživit stagnující trh. Pro uživatele otevírají nové možnosti využití umělé inteligence v každodenním životě, ať už pro nakupování, kreativní projekty nebo vyhledávání informací.

Zároveň tento vývoj zdůrazňuje probíhající konkurenci mezi hlavními technologickými společnostmi v oblasti asistentů s umělou inteligencí. Google, OpenAI, Apple a další neustále pracují na vylepšování svých asistentů a jejich vybavování novými funkcemi. To podporuje inovace a v nadcházejících letech by mohlo vést k ještě výkonnějším a intuitivnějším asistentům s umělou inteligencí.

S projektem Astra a novými funkcemi pro Gemini představuje Google svou dlouhodobou vizi pro asistenty s umělou inteligencí: měli by být univerzální, multimodální a hluboce integrovaní do každodenního života. Aktualizace představené na MWC 2025 jsou důležitým krokem tímto směrem a nabízejí pohled do budoucnosti interakce člověka se strojem.

Vhodné pro:

 

Váš globální partner pro marketing a rozvoj podnikání

☑️ Naším obchodním jazykem je angličtina nebo němčina

☑️ NOVINKA: Korespondence ve vašem národním jazyce!

 

Digitální průkopník - Konrad Wolfenstein

Konrad Wolfenstein

Rád vám a mému týmu posloužím jako osobní poradce.

Kontaktovat mě můžete vyplněním kontaktního formuláře nebo mi jednoduše zavolejte na číslo +49 89 89 674 804 (Mnichov) . Moje e-mailová adresa je: wolfenstein xpert.digital

Těším se na náš společný projekt.

 

 

☑️ Podpora MSP ve strategii, poradenství, plánování a implementaci

☑️ Vytvoření nebo přeladění digitální strategie a digitalizace

☑️ Rozšíření a optimalizace mezinárodních prodejních procesů

☑️ Globální a digitální obchodní platformy B2B

☑️ Pioneer Business Development / Marketing / PR / Veletrhy


⭐️ Umělá inteligence (AI) - Blog o AI, hotspot a centrum obsahu ⭐️ Digitální inteligence ⭐️ Tisk - Xpert Press Relations | Poradenství a služby ⭐️ XPaper