Megjelent: 2025. március 4. / Frissítés: 2025. március 4. - Szerző: Konrad Wolfenstein
Google Gemini Ki élő video-elemzéssel és képernyőmegosztással a Mobile-Mobile World Congress (MWC) 2025-IMAGE: XPert.Digital
Multimodális interakció: A Google AI asszisztens jövője
Új AI funkciók: Mit jelent a Gemini Boost a felhasználók számára
A barcelonai 2025 -ös Mobil világkongresszuson (MWC) a Google jelentős kiterjesztéseket mutatott be az AI asszisztens Gemini számára, amelynek új vizuális funkciók révén javítania kell a felhasználói élményt. A fő felújítások között szerepel az élő video elemzés és a képernyőmegosztási készségek, amelyek március végén elérhetőek lesznek a Google One AI prémium terv előfizetői számára. Ezek a fejlemények fontos mérföldkövet jelölnek a Google stratégiájában, hogy a mesterséges intelligencia mélyebben integrálja a mindennapi életbe, és javítsa a multimodális interakciót
Alkalmas:
- Mesterséges intelligencia és AI-alapú okostelefonok: Samsungs Galaxy AI a barcelonai mobil világkongresszuson
Az Ikrek új vizuális funkciói
Élő videoanalízis
Az MWC 2025 -en bemutatott egyik kiemelkedő innováció az Ikrek élő video funkciója. Ez a technológia lehetővé teszi a felhasználók számára, hogy valós időben megmutassák az AI -t, amit az okostelefon -kamera rögzít, és természetes párbeszédet vezet. A funkció először 2024 májusában volt a Google I/O konferencián, és most készen áll a bevezetésre. A Google által bemutatott demonstrációs videóban láthatja, hogy egy fazekas miként összpontosít a kerámia munkák gyűjteményére, és megkérdezi Gemini -t a következő váza színválasztásának tanácsáról. Az AI asszisztens elemzi a meglévő színeket, és jól megalapozott ajánlást ad a megfelelő mázhoz.
Ez a funkció a Gemini multimodális készségeit használja a vizuális információk valós időben történő feldolgozásához és a természetes beszélgetés összefüggésében. Ez a Google nagyobb projektjének része, amelyet „Project Astra” néven ismertek, és jelentős előrelépést jelentenek az AI asszisztensek fejlesztésében, akik kapcsolatba léphetnek a való világgal.
Képernyőmegosztási funkcionalitás
A második fontos vizuális bővítés a képernyőmegosztási funkció, amely lehetővé teszi a felhasználók számára, hogy megosszák az okostelefon képernyőjét az Ikrekkel. Amikor elindítja az Ikrek felületét az Androidon, egy új gomb jelenik meg, amelynek felirat a „Share Screen with Live” felirat jelenik meg, amelyen keresztül a felhasználó valós időben megoszthatja képernyőjét az AI asszisztenssel. Ezt a funkciót egy új értesítés kiegészíti egy telefonhívás stílusában, amely lehetővé teszi a zökkenőmentes integrációt a felhasználói felületbe.
A gyakorlati alkalmazási forgatókönyvekben az Ikrek segíthetnek például az online vásárlásban. Egy demonstrációs példában a Google megmutatja, hogy a felhasználó hogyan kérdezheti Geminit, hogy mi lenne jól a képernyőn megjelenített farmerhez. A Gemini ezután ajánlásokat adhat annak alapján, amit lát, és kísérheti a felhasználót a vásárlási folyamaton keresztül.
Műszaki részletek és elérhetőség
A bevezetés ütemterve
A Google 2025 márciusában tervezi az új élő video- és képernyőmegosztási funkciókat bevezetni a Gemini Advanced előfizetők számára. Ezeket a funkciókat a Google One AI prémium terv részeként kínálják, amely havonta 21,99 euróba kerül. Először is, a kiterjesztések csak az Android -eszközökre lesznek elérhetők, különösen a pixel és a Samsung eszközök, különösen az elsők között.
Integráció az Ikrek élőben
Az új vizuális funkciók integrálódnak a Gemini Live-be, a Google folyamatos AI asszisztensébe, amely lehetővé teszi a valós idejű tárgyalásokat. A Gemini Live -t frissítették a Gemini 2.0 Flash -rel, a multimodális modell verziójával, amelyet kifejezetten a gyors, mobil használatra optimalizáltak. Érdekes, hogy a képernyő kiadását egy új, telefonhívás stílusú értesítés támogatja, amelynek lehetővé kell tennie a zökkenőmentes integrációt a felhasználói élménybe.
Technológiai alap
Az új funkciók a Project Astra, a Google Universal Multimodal AI asszisztens projektjén alapulnak. A projekt célja egy asszisztens kidolgozása, aki valós időben képes feldolgozni a szöveges, video- és audioadatokat, és akár tíz perces beszélgetési környezetben menthet. Ennek a technológiának a Google Search, a Lencse és a Maps felhasználása is átfogó asszisztens élményt nyújthat.
Alkalmas:
- Google AI személyi asszisztens: Két változat létezik – a Gemini (normál verzió) és a Gemini Advanced (fizetős prémium verzió)
Ikrek az AI asszisztens piacának összefüggésében
Versenyhelyzet
Az új vizuális funkciókkal a Google stratégiailag pozicionálja a fő versenytársa, az Openai és a Chate ellen. A Chatgpt fejlett hang módja 2024 december óta támogatja az élő és a képernyőmegosztást. Azáltal, hogy ezeket a funkciókat a Gemini Live -be integrálja, a Google biztosítja, hogy AI asszisztense továbbra is versenyképes és összehasonlítható készségeket kínál.
Jelentése az okostelefon -ipar számára
A fejlett AI funkciók, például a Gemini bevezetése, amelyek fontos hatással lehetnek az okostelefon -iparra. Miután két évre csökkent az értékesítési adatok, amelyekben sok fogyasztó hosszabb ideig tartotta eszközeit, az AI asszisztensek integrálása új vásárlási ösztönzőket hozhat létre a kibővített készségekkel. Németországban, a Bitkom szerint, csak minden harmadiknak van egy évnél fiatalabb eszköz - 2023 -ban még mindig 55 százalék volt.
Az okostelefon -gyártók az új AI funkciókat differenciálási funkcióként használják, mivel az eszközök kívülről és technológiai szempontból nagyon hasonlóak. Például a Samsung megmutatja, hogy egy ügynök miként képes feladatokat végezni az új S25 okostelefon -alkalmazáson keresztül, míg az OPPO bemutatja a mesterséges intelligencia vizuális képességeit a képfeldolgozáshoz.
További frissítések az Ikrek számára
Kiterjesztett nyelvi támogatás
A vizuális funkciók mellett a Google kibővítette az Ikrek nyelvtudását is. Az AI asszisztens most már 45 nyelven megértheti és beszélhet. Különösen innovatív funkció az a képesség, hogy megváltoztassuk a nyelvet a mondat közepén anélkül, hogy megváltoztatnák a telefon nyelvi beállításait - "A Gemini Live megérti és megválaszolja".
Új kütyü az iPhone felhasználók számára
Noha a vizuális funkciók kezdetben csak az Android -eszközökhöz érhetők el, a Google bejelentette az iPhone -felhasználók frissítéseit is. A Gemini alkalmazás 1.2025.0762303 verziójával hat különböző zár képernyő kütyü kerül bevezetésre, amelyek lehetővé teszik az AI asszisztens gyorsabb hozzáférését. Ezek a kütyü tartalmazza az olyan lehetőségeket, mint az "Enter", a "Beszélgetés a Gemini Live", a "Nyissa meg a mikrofont", "Használja a kamerát", "Share Image" és "Share File". Ezek mind a zár képernyőn, mind az iPhone vezérlő központjában helyezhetők el, ami megkönnyíti a Gemini -hez való hozzáférést.
Ezt a fejleményt néhány megfigyelő úgy tekinti, hogy kísérlet az iPhone és az iPad felhasználóknak az Apple hangsegédje, a Siri hangos asszisztenséből. Az Apple állítólag lassan halad előre a Siri erősebb verziójának fejlesztésében, amely versenyezhet a vezető AI platformokkal.
Következtetés: Jelentés és kilátások
A Gemini által a Google által az MWC 2025 -en bemutatott Gemini frissítései fontos lépést jeleznek az AI asszisztensek fejlődésében. Az új vizuális funkciók-élési videó elemzés és a képernyő-megosztás lehetővé teszi, hogy intuitívabb és kontextushoz kapcsolódó interakcióval rendelkezzen a felhasználók és a mesterséges intelligencia között. Ezek a multimodális asszisztensek felé irányuló szélesebb körű fejlődés részét képezik, akik egyre inkább kölcsönhatásba léphetnek a való világgal.
Ezeknek a funkcióknak az integrációja messze képes hatással lehet a különböző területekre. Az okostelefon -ipar számára új vásárlási ösztönzőket hozhat létre és segíthet a stagnáló piac újjáélesztésében. A felhasználók számára új lehetőségeket nyitnak meg az AI használatára a mindennapi életben, legyen az vásárlás, kreatív projektek vagy információk keresése során.
Ugyanakkor ezek a fejlemények szemléltetik az AI asszisztensek területén működő nagy technológiai vállalatok közötti folyamatos versenyt. A Google, az Openai, az Apple és mások folyamatosan dolgoznak asszisztenseik javításán és új funkciókkal való felszerelése érdekében. Ez ösztönzi az innovációt, és az elkövetkező években még erősebb és intuitívabb AI asszisztensekhez vezethet.
A Project Astra és az Ikrek új funkcióival a Google megmutatja hosszú távú elképzelését az AI asszisztensek számára: univerzálisnak, multimodálisnak és mélyen a mindennapi életben kell lenniük. Az MWC 2025-en bemutatott frissítések ilyen módon fontos lépés, és betekintést nyújtanak az emberi gép interakció jövőjébe.
Alkalmas:
Az Ön globális marketing- és üzletfejlesztési partnere
☑️ Üzleti nyelvünk angol vagy német
☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!
Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.
Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein ∂ xpert.digital
Nagyon várom a közös projektünket.