Google Gemini KI med live videoanalys och skärmdelning Funktionalitet-Mobile World Congress (MWC) 2025

Publicerad: 4 mars 2025 / UPDATE Från: 4 mars 2025 - Författare: Konrad Wolfenstein

Google Gemini Ki med live videoanalys och skärmdelning Funktionalitet-Mobile World Congress (MWC) 2025-Image: Xpert.digital

Multimodal interaktion: framtiden för Google AI -assistenten

Nya AI -funktioner: Vad Gemini Boost betyder för användare

Vid Mobile World Congress (MWC) 2025 i Barcelona presenterade Google betydande tillägg för sin AI -assistent Gemini, vilket borde förbättra användarupplevelsen genom nya visuella funktioner. De viktigaste renoveringarna inkluderar live -videoanalys och skärmdelningsfärdigheter som kommer att finnas tillgängliga för prenumeranter på Google One AI Premium -planer i slutet av mars. Denna utveckling markerar en viktig milstolpe i Googles strategi för att integrera konstgjord intelligens djupare i vardagen och för att förbättra multimodal interaktion

Lämplig för detta:

Artificiell intelligens och AI-baserade smartphones: Samsungs Galaxy AI på Mobile World Congress i Barcelona

De nya visuella funktionerna för Gemini

Live Video Analys

En av de enastående innovationerna som presenteras på MWC 2025 är livevideofunktionen för Gemini. Denna teknik gör det möjligt för användare att visa AI i realtid vad din smarttelefonkamera fångar och att leda en naturlig dialog. Funktionen var för första gången i maj 2024 på Google I/O -konferensen och är nu redo för introduktionen. I en demonstrationsvideo som visas av Google kan du se hur en Potter fokuserar på en samling keramiskt arbete och frågar Gemini om råd om färgvalet för hennes nästa vas. AI-assistenten analyserar de befintliga färgerna och ger en välgrundad rekommendation för en lämplig glasyr.

Denna funktion använder Geminis multimodala färdigheter för att bearbeta visuell information i realtid och för att tolka i samband med en naturlig konversation. Det är en del av Googles större projekt, som kallas ”Project Astra”, och representerar betydande framsteg i utvecklingen av AI -assistenter som kan interagera med den verkliga världen.

Skärmdelningsfunktionalitet

Den andra viktiga visuella expansionen är skärmdelningsfunktionen, som gör det möjligt för användare att dela din smartphone -skärm med Gemini. När du startar Gemini -gränssnittet på Android visas en ny knapp med inskriptionen "Share -skärmen med live", genom vilken användaren kan dela sin skärm i realtid med AI -assistenten. Denna funktion kompletteras med en ny anmälan i stil med ett telefonsamtal, som möjliggör sömlös integration i användargränssnittet.

I praktiska applikationsscenarier kan Gemini till exempel hjälpa till med online -shopping. I ett demonstrationsexempel visar Google hur en användare kan fråga Gemini vad som skulle passa bra med en jeans som visas på skärmen. Gemini kan sedan ge rekommendationer baserade på vad den ser och följa användaren genom inköpsprocessen.

Tekniska detaljer och tillgänglighet

Tidsplan för introduktionen

Google planerar att lansera de nya livevideo- och skärmdelningsfunktionerna för Gemini Advanced -prenumeranter i mars 2025. Dessa funktioner erbjuds som en del av Google One AI Premium -planen, som kostar 21,99 euro per månad. För det första kommer tilläggarna endast att vara tillgängliga för Android -enheter, med Pixel- och Samsung -enheter i synnerhet bland de första som stöds.

Integration i Gemini Live

De nya visuella funktionerna är integrerade i Gemini Live, Googles kontinuerliga AI-assistent, som möjliggör realtidssamtal. Gemini Live uppdaterades med Gemini 2.0 Flash, en version av den multimodala modellen som var speciellt optimerad för snabb, mobil användning. Intressant nog stöds skärmutgivningen av en ny anmälan i stil med ett telefonsamtal, vilket skulle möjliggöra sömlös integration i användarupplevelsen.

Teknologisk grund

De nya funktionerna är baserade på Project Astra, Googles projekt för en universell multimodal AI -assistent. Syftet med detta projekt är att utveckla en assistent som kan bearbeta text-, video- och ljuddata i realtid och spara i en konversationskontext på upp till tio minuter. Denna teknik bör också kunna använda Google -sökning, lins och kartor för att erbjuda en omfattande assistentupplevelse.

Lämplig för detta:

Personlig AI-assistent från Google: Det finns två versioner-Gemini (standardversion) och Gemini Advanced (betald premiumversion)

Gemini i samband med AI -assistentmarknaden

Konkurrenskraft

Med de nya visuella funktionerna placerar Google sig strategiskt mot sin huvudsakliga konkurrent OpenAI och hans chatt. Det avancerade röstläget från ChatGPT har stött live- och skärmdelning sedan december 2024. Genom att integrera dessa funktioner i Gemini Live säkerställer Google att dess AI -assistent förblir konkurrenskraftig och erbjuder jämförbara färdigheter.

Betydelse för smartphonebranschen

Införandet av avancerade AI -funktioner som Gemini som kan ha en viktig inverkan på smarttelefonindustrin. Efter två års minskande försäljningssiffror där många konsumenter har hållit sina enheter längre, kan integrationen av AI -assistenter skapa nya köpincitament med utvidgade färdigheter. I Tyskland, enligt en bitkom, har bara varje tredjedel en enhet som är yngre än ett år - 2023 var det fortfarande 55 procent.

Smarttelefontillverkarna använder de nya AI -funktionerna som en differentieringsfunktion, eftersom enheterna är mycket lika på utsidan och tekniskt. Till exempel visar Samsung hur en agent kan utföra uppgifter över flera appar på den nya smarttelefonen S25, medan OPPO visar de visuella färdigheterna för konstgjord intelligens för bildbehandling.

Fler uppdateringar för Gemini

Utökat språkstöd

Förutom de visuella funktionerna har Google också utökat Geminis språkkunskaper. AI -assistenten kan nu förstå och tala på 45 språk. En särskilt innovativ funktion är förmågan att ändra språk i mitten av meningen utan att behöva ändra språkinställningarna för din telefon - "Gemini Live kommer att förstå och svara".

Nya widgetar för iPhone -användare

Även om de visuella funktionerna ursprungligen endast är tillgängliga för Android -enheter, har Google också meddelat uppdateringar för iPhone -användare. Med version 1.2025.0762303 i Gemini -appen introduceras sex olika låsskärm widgetar, vilket möjliggör snabbare åtkomst till AI -assistenten. Dessa widgetar inkluderar alternativ som "Enter", "Prata med Gemini Live", "Öppna mikrofonen", "Använd kamera", "Share Image" och "Share File". De kan placeras på både låsskärmen och i kontrollcentret av iPhone, vilket gör tillgång till Gemini enklare.

Denna utveckling ses av vissa observatörer som ett försök att locka iPhone och iPad -användare från Apples röstassistent Siri. Apple utvecklas enligt uppgift långsamt när det gäller att utveckla en mer kraftfull version av Siri, som kan konkurrera med de ledande AI -plattformarna.

Slutsats: Betydelse och Outlook

Uppdateringarna för Gemini som presenterades av Google på MWC 2025 markerar ett viktigt steg i utvecklingen av AI -assistenter. Den nya visuella funktioner-live-videoanalysen och skärmdelningsanpassningsbara mer intuitiva och kontextrelaterade interaktion mellan användare och konstgjord intelligens. De är en del av en bredare utveckling mot multimodala assistenter som i allt högre grad kan interagera med den verkliga världen.

Integrationen av dessa funktioner kan ha långtgående effekter på olika områden. För smarttelefonindustrin kan du skapa nya köpincitament och hjälpa till att återuppliva den stagnerande marknaden. För användare öppnar de nya möjligheter att använda AI i vardagen, vare sig det är när man shoppar, kreativa projekt eller när du letar efter information.

Samtidigt illustrerar denna utveckling den pågående konkurrensen mellan de stora teknikföretagen inom AI -assistenterna. Google, Openai, Apple och andra arbetar kontinuerligt för att förbättra sina assistenter och för att utrusta dem med nya funktioner. Detta driver innovation och kan leda till ännu kraftfullare och intuitiva AI -assistenter under de kommande åren.

Med Project Astra och de nya funktionerna för Gemini visar Google sin långsiktiga vision för AI-assistenter: de bör vara universella, multimodala och djupt in i vardagen. Uppdateringarna som presenteras på MWC 2025 är ett viktigt steg på detta sätt och ger en inblick i framtiden för interaktion mellan mänskliga maskiner.

Lämplig för detta: