Wybór głosu 📢


Google Gemini Ki z analizą wideo na żywo i udostępnianie ekranu Funkcjonalność Mobilna Światowa Kongres (MWC) 2025

Opublikowano: 4 marca 2025 / Aktualizacja od: 4 marca 2025 r. - Autor: Konrad Wolfenstein

Google Gemini Ki z analizą wideo na żywo i udostępnianie ekranu Funkcjonalność Mobilna Światowa Kongres (MWC) 2025

Google Gemini Ki z analizą wideo na żywo i udostępnianie ekranu Funkcjonalność Mobilna Światowa Kongres (MWC) 2025-Image: Xpert.digital

Interakcja multimodalna: przyszłość asystenta AI Google

Nowe funkcje AI: co oznacza wzmocnienie Bliźnięta dla użytkowników

Na Mobile World Congress (MWC) 2025 w Barcelonie Google przedstawił znaczne rozszerzenia dla asystenta AI Bliźnięta, które powinny poprawić wrażenia użytkownika poprzez nowe funkcje wizualne. Główne remonty obejmują analizę wideo na żywo i umiejętności udostępniania ekranu, które będą dostępne dla subskrybentów planu Google One AI Premium pod koniec marca. Rozwój te stanowią ważny kamień milowy w strategii Google polegającej na głębiej integracji sztucznej inteligencji z życiem codziennym i poprawie interakcji multimodalnych

Nadaje się do:

Nowe funkcje wizualne dla Bliźnięta

Analiza wideo na żywo

Jedną z wybitnych innowacji przedstawionych na MWC 2025 jest funkcja wideo na żywo dla Gemini. Ta technologia umożliwia użytkownikom pokazanie sztucznej inteligencji w czasie rzeczywistym, co przechwytuje aparat smartfona i prowadzić naturalny dialog. Funkcja była po raz pierwszy w maju 2024 r. Na konferencji Google I/O i jest teraz gotowa do wprowadzenia. W filmie demonstracyjnym pokazanym przez Google możesz zobaczyć, jak garncarz koncentruje się na zbiorze prac ceramicznych i prosi Gemini o porady dotyczące wyboru kolorów dla jej następnego wazonu. Asystent AI analizuje istniejące kolory i daje dobrze uzasadnioną rekomendację odpowiedniej glazury.

Ta funkcja wykorzystuje umiejętności multimodalne Gemini do przetwarzania informacji wizualnych w czasie rzeczywistym i do interpretacji w kontekście naturalnej rozmowy. Jest częścią większego projektu Google, znanego jako „Project Astra” i reprezentuje znaczny postęp w rozwoju asystentów AI, którzy mogą wchodzić w interakcje z prawdziwym światem.

Funkcja udostępniania ekranu

Drugim ważnym rozszerzeniem wizualnym jest funkcja udostępniania ekranu, która umożliwia użytkownikom udostępnianie ekranu smartfona z Gemini. Podczas uruchamiania interfejsu Gemini na Androidzie pojawia się nowy przycisk z napisem „Udostępnij ekran z Live”, za pomocą którego użytkownik może udostępnić swój ekran w czasie rzeczywistym z AII AI. Ta funkcja jest uzupełniona nowym powiadomieniem w stylu połączenia telefonicznego, który umożliwia bezproblemową integrację z interfejsem użytkownika.

W praktycznych scenariuszach aplikacji Gemini mogą na przykład pomóc w zakupach online. W przykładzie demonstracyjnym Google pokazuje, w jaki sposób użytkownik może zapytać Gemini, co dobrze pasuje do dżinsów wyświetlanych na ekranie. Bliźnięta może następnie udzielać rekomendacji na podstawie tego, co widzi i towarzyszyć użytkownikowi za pośrednictwem procesu zakupu.

Szczegóły techniczne i dostępność

Harmonogram wprowadzenia

Google planuje wprowadzić nowe funkcje udostępniania wideo na żywo dla subskrybentów Gemini Advanced w marcu 2025 r. Funkcje te są oferowane w ramach planu Google One AI Premium, który kosztuje 21,99 euro miesięcznie. Po pierwsze, rozszerzenia będą dostępne tylko dla urządzeń z Androidem, przy czym urządzenia Pixel i Samsung znajdują się wśród pierwszych, którzy zostali obsługiwani.

Integracja z Bliźnięta na żywo

Nowe funkcje wizualne są zintegrowane z Gemini Live, ciągłym asystentem AI Google, który umożliwia rozmowy w czasie rzeczywistym. Gemini Live został zaktualizowany o Gemini 2.0 Flash, wersję modelu multimodalnego, który został specjalnie zoptymalizowany do szybkiego, mobilnego użytku. Co ciekawe, wydanie ekranu jest obsługiwane przez nowe powiadomienie w stylu połączenia telefonicznego, które powinno umożliwić bezproblemową integrację z wrażeniami użytkownika.

Podstawa technologiczna

Nowe funkcje oparte są na projekcie Astra, projektu Google dla uniwersalnego multimodalnego asystenta AI. Celem tego projektu jest opracowanie asystenta, który może przetwarzać dane tekstowe, wideo i audio w czasie rzeczywistym i zapisywać w kontekście rozmowy do dziesięciu minut. Ta technologia powinna być również w stanie korzystać z wyszukiwania Google, obiektywu i map, aby zaoferować kompleksowe wrażenia asystenta.

Nadaje się do:

Bliźnięta w kontekście rynku AI Assistant

Pozycja konkurencyjna

Dzięki nowym funkcjom wizualnym Google strategicznie pozycjonuje się przeciwko głównemu konkurentowi Openai i jego czatowi. Zaawansowany tryb głosowy z Chatgpt obsługuje udostępnianie na żywo i ekranu od grudnia 2024 r. Integrując te funkcje w Gemini Live, Google zapewnia, że ​​jego asystent AI pozostaje konkurencyjny i oferuje porównywalne umiejętności.

Znaczenie dla przemysłu smartfonów

Wprowadzenie zaawansowanych funkcji AI, takich jak Gemini, które mogą mieć istotny wpływ na przemysł smartfonów. Po dwóch latach spadku liczby sprzedaży, w których wielu konsumentów utrzymywało swoje urządzenia dłużej, integracja asystentów AI mogłaby stworzyć nowe zachęty do zakupu z rozszerzonymi umiejętnościami. Według Bitkom w Niemczech tylko każda trzecia ma urządzenie, które jest młodsze niż rok - w 2023 r. Wciąż było to 55 procent.

Producenci smartfonów wykorzystują nowe funkcje AI jako funkcję różnicowania, ponieważ urządzenia są bardzo podobne na zewnątrz i technologicznie. Na przykład Samsung pokazuje, w jaki sposób agent może wykonywać zadania nad kilkoma aplikacjami na nowym smartfonie S25, podczas gdy Oppo pokazuje umiejętności wizualne sztucznej inteligencji do przetwarzania obrazu.

Więcej aktualizacji dla Gemini

Rozszerzone wsparcie języka

Oprócz funkcji wizualnych Google rozszerzył również umiejętności językowe Gemini. Asystent AI może teraz zrozumieć i mówić w 45 językach. Szczególnie innowacyjną funkcją jest zdolność do zmiany języka w środku zdania bez konieczności zmiany ustawień języka telefonu - „Bliźnięta na żywo zrozumie i odpowiedzą”.

Nowe widżety dla użytkowników iPhone'a

Chociaż funkcje wizualne są początkowo dostępne tylko dla urządzeń z Androidem, Google ogłosił również aktualizacje użytkowników iPhone'a. W wersji 1.2025.0762303 aplikacji Gemini wprowadzono sześć różnych widżetów ekranu blokady, które umożliwiają szybszy dostęp do asystenta AI. Te widżety zawierają takie opcje, jak „Enter”, „Talk to Gemini Live”, „Otwórz mikrofon”, „Użyj aparatu”, „Udostępnij obraz” i „Udostępnij plik”. Można je umieścić zarówno na ekranie blokady, jak i w centrum sterowania iPhone'a, co ułatwia dostęp do Gemini.

Ten rozwój jest postrzegany przez niektórych obserwatorów jako próba zwabienia użytkowników iPhone'a i iPada z asystenta głosowego Siri. Podobno Apple postępuje powoli w opracowywaniu mocniejszej wersji Siri, która może konkurować z wiodącymi platformami AI.

Wniosek: znaczenie i perspektywy

Aktualizacje gemini przedstawione przez Google na MWC 2025 stanowią ważny krok w ewolucji asystentów AI. Nowa analiza wideo wizualnych i życie wideo i udostępnianie ekranu bardziej intuicyjna i kontekstowa interakcja między użytkownikami a sztuczną inteligencją. Są częścią szerszego rozwoju wobec asystentów multimodalnych, którzy mogą coraz częściej wchodzić w interakcje ze światem rzeczywistym.

Integracja tych funkcji może mieć dalekosiężne efekty na różnych obszarach. W branży smartfonów możesz stworzyć nowe zachęty do zakupu i pomóc w ożywieniu stagnacyjnego rynku. Dla użytkowników otwierają nowe możliwości korzystania z sztucznej inteligencji w życiu codziennym, czy to podczas zakupów, kreatywnych projektów, czy w poszukiwaniu informacji.

Jednocześnie zmiany te ilustrują trwającą konkurencję między dużymi firmami technologicznymi w dziedzinie asystentów AI. Google, Openai, Apple i inni stale pracują nad ulepszeniem swoich asystentów i wyposażenie ich w nowe funkcje. Doprowadza to do innowacji i może prowadzić do jeszcze potężniejszych i intuicyjnych asystentów AI w nadchodzących latach.

Dzięki Project Astra i nowymi funkcjami Bliźnięta Google pokazuje swoją długoterminową wizję asystentów AI: powinny być uniwersalne, multimodalne i głęboko w życiu codziennym. Aktualizacje przedstawione na MWC 2025 są w ten sposób ważnym krokiem i dają wgląd w przyszłość interakcji ludzkiej.

Nadaje się do:

 

Twój globalny partner w zakresie marketingu i rozwoju biznesu

☑️Naszym językiem biznesowym jest angielski lub niemiecki

☑️ NOWOŚĆ: Korespondencja w Twoim języku narodowym!

 

Cyfrowy pionier – Konrad Wolfenstein

Konrada Wolfensteina

Chętnie będę służyć Tobie i mojemu zespołowi jako osobisty doradca.

Możesz się ze mną skontaktować wypełniając formularz kontaktowy lub po prostu dzwoniąc pod numer +49 89 89 674 804 (Monachium) . Mój adres e-mail to: wolfenstein xpert.digital

Nie mogę się doczekać naszego wspólnego projektu.

 

 

☑️ Wsparcie MŚP w zakresie strategii, doradztwa, planowania i wdrażania

☑️ Stworzenie lub dostosowanie strategii cyfrowej i cyfryzacji

☑️Rozbudowa i optymalizacja procesów sprzedaży międzynarodowej

☑️ Globalne i cyfrowe platformy handlowe B2B

☑️ Pionierski rozwój biznesu / marketing / PR / targi


⭐️ Sztuczna inteligencja (AI) - blog AI, hotspot i centrum treści ⭐️ Inteligencja cyfrowa ⭐️ Prasa - prace prasowe ekspertów | Doradztwo i oferta ⭐️ XPaper