Webbplatsikon Xpert.digital

Google Gemini KI med live videoanalys och skärmdelning Funktionalitet-Mobile World Congress (MWC) 2025

Google Gemini KI med live videoanalys och skärmdelning Funktionalitet-Mobile World Congress (MWC) 2025

Google Gemini AI med livevideoanalys och skärmdelningsfunktionalitet – Mobile World Congress (MWC) 2025 – Bild: Xpert.Digital

Multimodal interaktion: Framtiden för Google AI-assistenten

Nya AI-funktioner: Vad Gemini Boost betyder för användare

På Mobile World Congress (MWC) 2025 i Barcelona presenterade Google betydande förbättringar för sin AI-assistent Gemini, utformade för att förbättra användarupplevelsen genom nya visuella funktioner. De viktigaste tilläggen inkluderar livevideoanalys och skärmdelningsfunktioner, som kommer att vara tillgängliga för prenumeranter på Google One AI-premiumplanen i slutet av mars. Dessa utvecklingar markerar en viktig milstolpe i Googles strategi att integrera artificiell intelligens djupare i vardagen och förbättra multimodal interaktion

Lämplig för detta:

De nya visuella funktionerna för Gemini

Analys av livevideo

En av de mest framstående innovationerna som Google presenterade på MWC 2025 är livevideofunktionen för Gemini. Denna teknik låter användare visa AI:n i realtid vad deras smartphonekamera fångar och engagera sig i en naturlig dialog. Funktionen, som först visades upp på Googles I/O-konferens i maj 2024, är nu redo för lansering. I en demonstrationsvideo som Google visar riktar en keramiker sin kamera mot en samling keramiska föremål och ber Gemini om råd om hur man väljer färger till sin nästa vas. AI-assistenten analyserar de tillgängliga färgerna och ger en välgrundad rekommendation för en lämplig glasyr.

Den här funktionen utnyttjar Gemini's multimodala kapacitet för att bearbeta visuell information i realtid och tolka den inom ramen för en naturlig konversation. Den är en del av Googles större projekt, känt som "Project Astra", och representerar ett betydande framsteg i utvecklingen av AI-assistenter som kan interagera med den verkliga världen.

Skärmdelningsfunktion

Den andra viktiga visuella förbättringen är skärmdelningsfunktionen, som låter användare dela sin smartphone-skärm med Gemini. När Gemini-gränssnittet lanseras på Android visas en ny knapp med namnet "Dela skärm med Live", vilket gör det möjligt för användare att dela sin skärm med AI-assistenten i realtid. Denna funktion kompletteras av en ny avisering utformad som ett telefonsamtal, vilket möjliggör sömlös integration i användargränssnittet.

I praktiska tillämpningar kan Gemini använda den här funktionen för att till exempel hjälpa till med onlineshopping. I en demonstration visar Google hur en användare kan fråga Gemini vad som skulle passa bra till ett par jeans som visas på skärmen. Baserat på vad Gemini ser kan de sedan ge rekommendationer och vägleda användaren genom shoppingprocessen.

Tekniska detaljer och tillgänglighet

Tidslinje för introduktionen

Google planerar att lansera de nya funktionerna för livevideo och skärmdelning till Gemini Advanced-prenumeranter redan i mars 2025. Dessa funktioner kommer att erbjudas som en del av Google One AI Premium-planen, som kostar 21,99 euro per månad. Inledningsvis kommer förbättringarna endast att vara tillgängliga för Android-enheter, med Pixel- och Samsung-enheter bland de första som stöds.

Integrering i Gemini Live

De nya visuella funktionerna är integrerade i Gemini Live, Googles kontinuerliga AI-assistent som möjliggör samtal i realtid. Gemini Live har uppdaterats med Gemini 2.0 Flash, en version av den multimodala modellen som är specifikt optimerad för snabb, mobil användning. Intressant nog stöds skärmdelning av en ny avisering utformad som ett telefonsamtal, vilket möjliggör sömlös integration i användarupplevelsen.

Teknologisk grund

De nya funktionerna är baserade på Project Astra, Googles initiativ för en universell, multimodal AI-assistent. Målet med projektet är att utveckla en assistent som kan bearbeta text-, video- och ljuddata i realtid och lagra den i ett samtalssammanhang på upp till tio minuter. Denna teknik är också avsedd att utnyttja Google Search, Lens och Maps för att ge en heltäckande assistentupplevelse.

Lämplig för detta:

Gemini i samband med marknaden för AI-assistenter

Konkurrenskraftig positionering

Med dessa nya visuella funktioner positionerar sig Google strategiskt mot sin huvudkonkurrent, OpenAI, och sin ChatGPT. ChatGPT:s avancerade röstläge har stöd för live- och skärmdelning sedan december 2024. Genom att integrera dessa funktioner i Gemini Live säkerställer Google att deras AI-assistent förblir konkurrenskraftig och erbjuder jämförbara funktioner.

Betydelse för smartphoneindustrin

Införandet av avancerade AI-funktioner som de som erbjuds av Gemini skulle kunna få en betydande inverkan på smarttelefonindustrin. Efter två år av minskande försäljning, under vilka många konsumenter behöll sina enheter längre, skulle integrationen av AI-assistenter med förbättrade funktioner kunna skapa nya köpincitament. I Tyskland, enligt en undersökning av Bitkom, äger nu bara en av tre personer en enhet som är mindre än ett år gammal – en minskning från 55 procent år 2023.

Smarttelefontillverkare använder de nya AI-funktionerna som en differentieringsfaktor, eftersom enheterna är mycket lika i utseende och teknik. Till exempel demonstrerar Samsung hur en agent på sin nya smartphone S25 kan utföra uppgifter över flera appar, medan Oppo visar upp de visuella förmågorna hos artificiell intelligens för bildbehandling.

Fler uppdateringar för Gemini

Förbättrat språkstöd

Utöver sina visuella funktioner har Google även utökat Gemini:s språkfunktioner. AI-assistenten kan nu förstå och tala på 45 språk. En särskilt innovativ funktion är dess möjlighet att byta språk mitt i en mening utan att användare behöver ändra telefonens språkinställningar – ”Gemini Live förstår och svarar.”

Nya widgetar för iPhone-användare

Även om de visuella funktionerna initialt endast kommer att vara tillgängliga för Android-enheter har Google även aviserat uppdateringar för iPhone-användare. Version 1.2025.0762303 av Gemini-appen introducerar sex olika låsskärmswidgetar som ger snabbare åtkomst till AI-assistenten. Dessa widgetar inkluderar alternativ som "Skriv meddelande", "Prata med Gemini Live", "Öppna mikrofon", "Använd kamera", "Dela bild" och "Dela fil". De kan placeras både på låsskärmen och i iPhones kontrollcenter, vilket gör det enklare att komma åt Gemini.

Vissa bedömare tolkar denna utveckling som ett försök att locka iPhone- och iPad-användare bort från Apples röstassistent, Siri. Rapporter tyder på att Apple gör långsamma framsteg med att utveckla en kraftfullare version av Siri som kan konkurrera med ledande AI-plattformar.

Slutsats: Betydelse och framtidsutsikter

Uppdateringarna för Gemini, som presenterades av Google på MWC 2025, markerar ett viktigt steg i utvecklingen av AI-assistenter. De nya visuella funktionerna – livevideoanalys och skärmdelning – möjliggör mer intuitiv och kontextmedveten interaktion mellan användare och den artificiella intelligensen. De är en del av en bredare utveckling mot multimodala assistenter som i allt högre grad kan interagera med den verkliga världen.

Integreringen av dessa funktioner skulle kunna få långtgående effekter inom olika sektorer. För smarttelefonindustrin skulle de kunna skapa nya köpincitament och bidra till att återuppliva den stagnerande marknaden. För användarna öppnar de upp nya möjligheter att använda AI i vardagen, oavsett om det gäller shopping, kreativa projekt eller informationssökningar.

Samtidigt belyser dessa utvecklingar den fortsatta konkurrensen mellan stora teknikföretag inom området AI-assistenter. Google, OpenAI, Apple och andra arbetar kontinuerligt med att förbättra sina assistenter och utrusta dem med nya funktioner. Detta driver innovation och kan leda till ännu kraftfullare och mer intuitiva AI-assistenter under de kommande åren.

Med Project Astra och de nya funktionerna för Gemini visar Google upp sin långsiktiga vision för AI-assistenter: de ska vara universella, multimodala och djupt integrerade i vardagen. Uppdateringarna som presenterades på MWC 2025 är ett viktigt steg i denna riktning och ger en inblick i framtiden för människa-maskin-interaktion.

Lämplig för detta:

 

Din globala marknadsförings- och affärsutvecklingspartner

☑ Vårt affärsspråk är engelska eller tyska

☑ Nytt: korrespondens på ditt nationella språk!

 

Konrad Wolfenstein

Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.

Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein xpert.digital

Jag ser fram emot vårt gemensamma projekt.

 

 

☑ SME -stöd i strategi, rådgivning, planering och implementering

☑ skapande eller omjustering av den digitala strategin och digitaliseringen

☑ Expansion och optimering av de internationella försäljningsprocesserna

☑ Globala och digitala B2B -handelsplattformar

☑ Pioneer Business Development / Marketing / PR / Measure

Lämna den mobila versionen