Udgivet den: 4. marts 2025 / Opdateret den: 4. marts 2025 – Forfatter: Konrad Wolfenstein

Google Gemini AI med live videoanalyse og skærmdelingsfunktionalitet – Mobile World Congress (MWC) 2025 – Billede: Xpert.Digital
Multimodal interaktion: Fremtiden for Google AI Assistant
Nye AI-funktioner: Hvad Gemini Boost betyder for brugerne
På Mobile World Congress (MWC) 2025 i Barcelona afslørede Google betydelige forbedringer til sin AI-assistent Gemini, der er designet til at forbedre brugeroplevelsen gennem nye visuelle funktioner. De vigtigste tilføjelser inkluderer live videoanalyse og skærmdelingsfunktioner, som vil være tilgængelige for abonnenter på Google One AI-premiumabonnementet i slutningen af marts. Disse udviklinger markerer en vigtig milepæl i Googles strategi om at integrere kunstig intelligens dybere i hverdagen og forbedre multimodal interaktion
Relateret til dette:
- Kunstig intelligens og AI-drevne smartphones: Samsungs Galaxy AI på Mobile World Congress i Barcelona
De nye visuelle funktioner til Gemini
Live videoanalyse
En af de mest bemærkelsesværdige innovationer, som Google afslørede på MWC 2025, er livevideofunktionen til Gemini. Denne teknologi giver brugerne mulighed for at vise AI'en i realtid, hvad deres smartphonekamera optager, og engagere sig i en naturlig dialog. Funktionen, der først blev vist på Googles I/O-konference i maj 2024, er nu klar til lancering. I en demonstrationsvideo vist af Google peger en keramiker sit kamera mod en samling af keramiske stykker og beder Gemini om råd til at vælge farver til sin næste vase. AI-assistenten analyserer de tilgængelige farver og giver en informeret anbefaling til en passende glasur.
Denne funktion udnytter Gemini's multimodale muligheder til at behandle visuel information i realtid og fortolke den inden for rammerne af en naturlig samtale. Det er en del af Googles større projekt, kendt som "Project Astra", og repræsenterer et betydeligt fremskridt i udviklingen af AI-assistenter, der er i stand til at interagere med den virkelige verden.
Skærmdelingsfunktion
Den anden vigtige visuelle forbedring er skærmdelingsfunktionen, som giver brugerne mulighed for at dele deres smartphone-skærm med Gemini. Når Gemini-grænsefladen lanceres på Android, vises en ny knap med navnet "Del skærm med Live", der giver brugerne mulighed for at dele deres skærm med AI-assistenten i realtid. Denne funktion suppleres af en ny notifikation, der er designet som et telefonopkald, hvilket muliggør problemfri integration i brugergrænsefladen.
I praktiske anvendelsesscenarier kan Gemini bruge denne funktion til at hjælpe med f.eks. online shopping. I en demonstration viser Google, hvordan en bruger kan spørge Gemini, hvad der ville passe godt til et par jeans, der vises på skærmen. Baseret på det, Gemini ser, kan de derefter komme med anbefalinger og guide brugeren gennem shoppingprocessen.
Tekniske detaljer og tilgængelighed
Tidslinje for introduktionen
Google planlægger at udrulle de nye livevideo- og skærmdelingsfunktioner til Gemini Advanced-abonnenter allerede i marts 2025. Disse funktioner vil blive tilbudt som en del af Google One AI Premium-abonnementet, som koster €21,99 om måneden. I første omgang vil forbedringerne kun være tilgængelige for Android-enheder, hvor Pixel- og Samsung-enheder er blandt de første, der understøttes.
Integration i Gemini Live
De nye visuelle funktioner er integreret i Gemini Live, Googles kontinuerlige AI-assistent, der muliggør samtaler i realtid. Gemini Live er blevet opdateret med Gemini 2.0 Flash, en version af den multimodale model, der er specifikt optimeret til hurtig, mobil brug. Interessant nok understøttes skærmdeling af en ny notifikation, der er designet som et telefonopkald, hvilket muliggør problemfri integration i brugeroplevelsen.
Teknologisk grundlag
De nye funktioner er baseret på Project Astra, Googles initiativ til en universel, multimodal AI-assistent. Målet med dette projekt er at udvikle en assistent, der kan behandle tekst-, video- og lyddata i realtid og gemme dem i en samtalekontekst på op til ti minutter. Denne teknologi er også beregnet til at udnytte Google Search, Lens og Maps til at give en omfattende assistentoplevelse.
Relateret til dette:
- Googles personlige AI-assistent: Der er to versioner – Gemini (standardversion) og Gemini Advanced (betalt premiumversion)
Gemini i forbindelse med markedet for AI-assistenter
Konkurrencepræget positionering
Med disse nye visuelle funktioner positionerer Google sig strategisk i forhold til sin hovedkonkurrent, OpenAI, og deres ChatGPT. ChatGPTs avancerede stemmetilstand har understøttet live- og skærmdeling siden december 2024. Ved at integrere disse funktioner i Gemini Live sikrer Google, at deres AI-assistent forbliver konkurrencedygtig og tilbyder sammenlignelige muligheder.
Betydning for smartphoneindustrien
Introduktionen af avancerede AI-funktioner som dem, der tilbydes af Gemini, kan have en betydelig indflydelse på smartphoneindustrien. Efter to år med faldende salg, hvor mange forbrugere beholdt deres enheder i længere tid, kan integrationen af AI-assistenter med forbedrede funktioner skabe nye købsincitamenter. I Tyskland ejer ifølge en undersøgelse foretaget af Bitkom nu kun én ud af tre personer en enhed, der er mindre end et år gammel – et fald fra 55 procent i 2023.
Smartphoneproducenter bruger de nye AI-funktioner som en differentieringsfaktor, da enhederne ligner hinanden meget i udseende og teknologi. For eksempel demonstrerer Samsung, hvordan en agent på sin nye S25-smartphone kan udføre opgaver på tværs af flere apps, mens Oppo fremviser de visuelle muligheder for kunstig intelligens til billedbehandling.
Flere opdateringer til Gemini
Forbedret sprogunderstøttelse
Udover sine visuelle funktioner har Google også udvidet Gemini's sprogfunktioner. AI-assistenten kan nu forstå og tale på 45 sprog. En særlig innovativ funktion er dens evne til at skifte sprog midt i en sætning uden at brugerne behøver at ændre deres telefons sprogindstillinger – "Gemini Live vil forstå og svare.".
Nye widgets til iPhone-brugere
Selvom de visuelle funktioner i første omgang kun vil være tilgængelige for Android-enheder, har Google også annonceret opdateringer til iPhone-brugere. Version 1.2025.0762303 af Gemini-appen introducerer seks forskellige låseskærmswidgets, der giver hurtigere adgang til AI-assistenten. Disse widgets inkluderer muligheder som "Skriv prompt", "Tal med Gemini Live", "Åbn mikrofon", "Brug kamera", "Del billede" og "Del fil". De kan placeres både på låseskærmen og i iPhones kontrolcenter, hvilket gør det nemmere at få adgang til Gemini.
Nogle iagttagere fortolker denne udvikling som et forsøg på at lokke iPhone- og iPad-brugere væk fra Apples stemmeassistent, Siri. Rapporter tyder på, at Apple gør langsomme fremskridt med at udvikle en mere kraftfuld version af Siri, der kan konkurrere med førende AI-platforme.
Konklusion: Betydning og udsigter
Opdateringerne til Gemini, som Google præsenterede på MWC 2025, markerer et vigtigt skridt i udviklingen af AI-assistenter. De nye visuelle funktioner – live videoanalyse og skærmdeling – muliggør mere intuitiv og kontekstbevidst interaktion mellem brugere og den kunstige intelligens. De er en del af en bredere udvikling mod multimodale assistenter, der i stigende grad kan interagere med den virkelige verden.
Integrationen af disse funktioner kan have vidtrækkende virkninger på tværs af forskellige sektorer. For smartphoneindustrien kan de skabe nye købsincitamenter og bidrage til at revitalisere det stagnerende marked. For brugerne åbner de op for nye muligheder for at bruge AI i hverdagen, hvad enten det er til shopping, kreative projekter eller informationssøgning.
Samtidig understreger disse udviklinger den igangværende konkurrence mellem store teknologivirksomheder inden for AI-assistenter. Google, OpenAI, Apple og andre arbejder løbende på at forbedre deres assistenter og udstyre dem med nye funktioner. Dette driver innovation og kan føre til endnu mere kraftfulde og intuitive AI-assistenter i de kommende år.
Med Project Astra og de nye funktioner til Gemini fremviser Google sin langsigtede vision for AI-assistenter: de skal være universelle, multimodale og dybt integrerede i hverdagen. Opdateringerne, der blev præsenteret på MWC 2025, er et vigtigt skridt i denne retning og giver et glimt ind i fremtiden for menneske-maskine-interaktion.
Relateret til dette:
Din globale marketing- og forretningsudviklingspartner
☑️ Vores forretningssprog er engelsk eller tysk
☑️ NYT: Korrespondance på dit modersmål!
Jeg og mit team er glade for at stå til rådighed for dig som din personlige rådgiver.
Du kan kontakte mig ved at udfylde kontaktformularen her eller blot ringe til mig på +49 89 89 674 804 ( München) . Min e-mailadresse er: [email protected]
Jeg glæder mig til vores fælles projekt.













