Megjelent: 2025. március 9. / Frissítve: 2025. március 9. – Szerző: Konrad Wolfenstein

A Google okosszemüveg-stratégiája a Project Astra és a Gemini Live segítségével: A vizuális mesterséges intelligencia alapú segítségnyújtás új korszaka a Google-tól – Kép: Xpert.Digital
Okosszemüvegek egy csavarral: a Google víziója a technológia új korszakáról
Paradigmaváltás a láthatáron: a Google útja az intelligens mesterséges intelligencia felé a mindennapi életben
A Google jelentős technológiai fejlődés küszöbén áll a viselhető technológia terén. A Gemini Live-val kapcsolatos legújabb fejlemények, valamint az új okosszemüvegekre vonatkozó konkrét tervek egy küszöbön álló paradigmaváltásra utalnak, amely alapvetően megváltoztathatja a mesterséges intelligenciával való interakciónkat. A vizuális felismerési képességek integrálása az okostelefonokon található Gemini Live-ba technológiai alapot teremt a jövőbeli okosszemüveg-megoldásokhoz, és stratégiai fordulópontot jelent a Google azon víziójában, hogy a mesterséges intelligencia mindenütt jelen legyen a mindennapi életben.
Alkalmas:
A második próbálkozás: a Google visszatérése az okosszemüvegek piacára
A Google első próbálkozása az okosszemüvegek terén több mint egy évtizedre nyúlik vissza. A 2012-ben bemutatott és 2015-ben a fogyasztók számára kivont Google Glass sok tekintetben megelőzte korát. A mindössze 42 grammot súló szemüveg viszonylag könnyű volt, de gyakorlati korlátokkal küzdött, például rövid, mindössze két-három órás akkumulátor-üzemidővel – ami egyértelműen nem volt elegendő egy produktív munkanaphoz. Továbbá hiányzott belőlük az a kulcsfontosságú elem, ami a mai okosszemüvegeket forradalmivá tehetné: a fejlett generatív mesterséges intelligencia.
A Google Glass kereskedelmi kudarcát követően a cég a vállalati alkalmazásokra összpontosított, és nagyrészt kivonult a fogyasztói piacról. Mindeközben maga a technológia is tovább fejlődött. A Google néhány évvel ezelőtti felvásárlása a Focal okosszemüvegeket gyártó Northnak már jelezte a tartós érdeklődést e termékkategória iránt. Az új okosszemüvegek, amelyeket a Google most fejleszt, jelentősen vékonyabbak és kényelmesebbek lesznek, mint a Focalok, így magukban foglalják a korábbi generációk tapasztalatait.
Friss jelentések szerint a Google tárgyalásokat folytat olyan neves szemüveggyártókkal, mint az EssilorLuxottica, amely a Ray-Ban tulajdonosa is. Ez a stratégiai lépés segíthet a Google-nek megkerülni a Google Glass egyik fő problémáját: a divatos elfogadottság hiányát. A Ray-Ban már rendelkezik tapasztalattal az okos napszemüvegek terén a Metával való együttműködés révén. Ezek a partnerségek kulcsfontosságúak lehetnek abban, hogy az új okosszemüveget divatkiegészítőként, és ne pedig hivalkodó technológiai bemutatóként pozicionálják.
Alkalmas:
Project Astra: A Google vizuális mesterséges intelligencia segítségnyújtásának alapja
A Google okosszemüveg-stratégiájának középpontjában a „Project Astra” áll – egy ambiciózus kutatási projekt, amelynek célja egy univerzális vizuális mesterséges intelligencia asszisztens fejlesztése. A Google először a 2024 májusában tartott I/O fejlesztői konferenciáján mutatta be a Project Astrát, egy lenyűgöző technikai bemutatót tartva, amely rávilágított a vizuális mesterséges intelligencia asszisztensben rejlő lehetőségekre.
Egy jelentős szervezeti átszervezés részeként a Google nemrégiben integrálta a Project Astra csapatát a Gemini csapatába. Ez az egyesülés hangsúlyozza a Gemini központi szerepét a Google okosszemüvegekkel kapcsolatos víziójában, és azt mutatja, hogy mindkét technológiát egységes stratégia részeként tekintik. A Gemini-n belül az Astra csapata kifejezetten az élő funkciókra fog összpontosítani, továbbfejlesztve a Gemini vizuális komponensét.
A Project Astra technológiai alapjai figyelemre méltóan fejlettek. A Google Glass-szel ellentétben, amely egy évtizeddel ezelőtt inkább futurisztikus vízió volt, mint kiforrott termék, a Project Astra olyan realisztikus technológiákon alapul, amelyek már ma is elérhetők. A Google I/O-n tartott bemutató bemutatta, hogyan képes a felhasználó okosszemüvegen keresztül szemlélni a környezetét, és egyidejűleg beszélni róla egy mesterséges intelligencia által vezérelt asszisztenssel. Ami tizenegy évvel ezelőtt még csak vágyálomnak tűnt, ma már technikailag megvalósítható.
Gemini Live: Híd az okostelefon és az okosszemüveg között
A Gemini Live legújabb fejlesztései kulcsfontosságú hidat képeznek a jelenlegi okostelefon-alkalmazások és a közelgő okosszemüvegek között. 2025 márciusában a Google jelentős fejlesztéseket jelentett be a Gemini Live-hoz, elsősorban a mesterséges intelligencia asszisztens vizuális képességeit javítva.
Az új funkciók közé tartozik az élő videó bemenet és a képernyőmegosztás, amelyek lehetővé teszik a felhasználók számára, hogy valós időben beszéljenek a Geminivel a látottakról. Ezeket a funkciókat a Gemini 2.0 Flash biztosítja, amely a multimodális modell kifejezetten gyors, mobilalkalmazásokhoz optimalizált verziója. 2025 márciusának végétől kezdődően ezek a funkciók elérhetőek lesznek a Gemini Advanced előfizetői számára Android-eszközökön a Google One AI Premium csomag részeként.
Ezek az új funkciók rendkívül intuitív módon működnek: a felhasználók okostelefonjuk kameráját egy érdekes tárgyra irányíthatják, és közvetlenül kérdéseket tehetnek fel a Gemininek róla. A mesterséges intelligencia asszisztens valós időben elemzi a videoképet, és kontextuális információkat nyújt. A felhasználók megoszthatják képernyőjüket a Geminivel, és megbeszélhetik a látottakat, miközben okostelefonjukon interakcióba lépnek a mesterséges intelligencia robottal.
Ezeket a funkciókat nem csupán elszigetelt okostelefon-funkcióknak kell tekinteni, hanem inkább a tervezett okosszemüveg-funkcionalitás közvetlen előfutárainak. Maga a Google is egyértelművé teszi ezt a kapcsolatot: „A Gemini Live vizuális komponensével lényegében az a felület, amelyet a Google a közeljövőben az okosszemüvegekhez kíván használni.” Az okostelefon-alkalmazás és az okosszemüveg közötti döntő különbség végső soron csak abban rejlik, hogy az okostelefon kijelzőjét vagy az okosszemüveg kamerájának képét osztják-e meg – az alapul szolgáló technológia azonos.
A Google hamarosan megjelenő okosszemüvegei
A Google új okosszemüvege várhatóan jelentős előrelépést jelent majd a korábbi próbálkozásokhoz képest. A Gemini központi elemként fog szolgálni, amely folyamatosan elérhető lesz a felhasználók számára mind hang-, mind vizuális visszajelzés formájában. A felhasználó látótere véglegesen üres lesz a Gemini számára, lehetővé téve a mesterséges intelligencia által vezérelt bot számára, hogy virtuálisan interakcióba lépjen a felhasználóval a való világban.
A Gemini API Fejlesztői Versenyre benyújtott „Gemini Sight” projekt olyan mesterséges intelligenciával vezérelt okosszemüvegek koncepcióit mutatta be, amelyek különösen hasznosak lehetnek a vak és gyengénlátó emberek számára. Ezeket a forradalmian új, mesterséges intelligenciával vezérelt okosszemüvegeket úgy tervezték, hogy zökkenőmentesen integrálódjanak a Google szolgáltatásaival, és egyszerű hangutasításokkal automatizáljanak számos feladatot – a naptárkezeléstől és az e-mailek küldésétől kezdve az éttermi asztalfoglalásokig.
Egy kiválasztott csoportnak már lehetősége nyílt gyakorlati tapasztalatot szerezni a Gemini mesterséges intelligencia szemüveggel. A jelentések szerint a szemüveg valóban azt a Google Glass élményt nyújtja, amelyet a Google több mint egy évtizeddel ezelőtt nem tudott elérni. A technológiai fejlődés, különösen a generatív mesterséges intelligencia területén, ma már lehetővé teszi azt, ami egykor csak vágyálom volt.
Integráció a Google szolgáltatásaival és multimodális képességeivel
A közelgő okosszemüvegek egyik kulcsfontosságú aspektusa a meglévő Google-szolgáltatásokkal való átfogó integrációjuk. A Gemini már számos Google-alkalmazáshoz és -szolgáltatáshoz csatlakoztatható, beleértve a Gmailt, a Google Drive-ot, a Google Dokumentumokat, a Google Térképet, a YouTube-ot, a Google Flights-ot és a Google Hotels-t. Ezek a kapcsolatok lehetővé teszik az Asszisztens számára, hogy gyorsabban megtalálja a releváns információkat, és automatizálja az összetett feladatokat.
A Gemini Live multimodális képességei folyamatosan bővülnek. Az eredetileg csak angol nyelven elérhető Gemini Live mára több mint 45 nyelvet támogat, köztük a németet is. Ez a nyelvi sokoldalúság kulcsfontosságú lépés az okosszemüvegek globális bevezetése felé. Különösen figyelemre méltó, hogy ugyanazon az eszközön akár két nyelven is lehet beszélgetést folytatni, sőt, mondat közben is lehet nyelvet váltani.
A Gemini Live vizuális képességei messze túlmutatnak az egyszerű képelemzésen. A felhasználók feltölthetnek fotókat vagy megnézhetnek YouTube-videókat, és egyidejűleg megbeszélhetik azokat a Geminivel. A videók segítségével a Gemini összefoglalhatja a tartalmat, és válaszolhat a kapcsolódó kérdésekre, például egy YouTube-on található termékértékeléssel kapcsolatos kérdésekre. PDF-ek segítségével a mesterséges intelligencia nemcsak összefoglalhatja és megválaszolhatja a kérdéseket, hanem kvízeket is létrehozhat a felhasználók tudásának tesztelésére.
Alkalmas:
- A Google AI mód előnyei más AI -keresési termékekhez képest, mint például a zavarás AI és az Openai CHATGPT keresése
Piaci potenciál és társadalmi hatás
A mesterséges intelligencia által vezérelt okosszemüvegek piaci potenciálja óriási. Míg a Google Glass elsősorban az adatvédelmi aggályok és a gyakorlati használhatóság miatt bukott meg, a Gemini integrációja részben leküzdheti ezeket a kihívásokat. A gyakorlati alkalmazások sokrétűek, a mindennapi segédeszközöktől és a speciális professzionális alkalmazásoktól kezdve a fogyatékkal élők számára készült segítő rendszerekig.
Mindazonáltal továbbra is fontos kérdések merülnek fel, különösen az adatvédelemmel kapcsolatban. A látómező folyamatos megosztása egy mesterséges intelligenciával új etikai és jogi kérdéseket vet fel, amelyekkel a Google-nek foglalkoznia kell ahhoz, hogy szélesebb körű elfogadottságot érjen el, mint a Google Glass esetében. A neves szemüveggyártókkal való együttműködés segíthet abban, hogy a technológia kifinomultabb és társadalmilag elfogadhatóbb legyen.
A Google intenzív versenyben áll más technológiai vállalatokkal a kiterjesztett valóság területén. Míg az Apple egy átfogóbb XR-megoldást keres a Vision Pro készülékével, a Google a kiterjesztett valóság egy könnyebb, mindennapibb formájára összpontosít okosszemüvegeivel. A Google bejelentette az Android XR fejlesztését is, amely platform mind az okosszemüvegeket, mind az átfogóbb VR-headsetek támogatására szolgál.
A Gemini Live az ember és a mesterséges intelligencia interakciójának új korszakának előfutáraként szolgál
A vizuális képességek Gemini Live-ba való integrálása kulcsfontosságú lépés a Google hosszú távú, mindenütt jelenlévő mesterséges intelligencia segítségnyújtásra vonatkozó víziójában. Ami az okostelefonokon kezdődik, várhatóan a hamarosan megjelenő okosszemüvegekben csúcsosodik ki. A technológiai alapok már adottak, és a Google az okostelefonok széles körű elterjedését használja ki tesztelési alapként olyan funkciókhoz, amelyeket később az okosszemüvegekben is megvalósítanak.
A Gemini Live fejlesztése jól szemlélteti a Google stratégiai megközelítését: az új mesterséges intelligencia funkcióit először okostelefonokon vezetik be, tesztelik és optimalizálják, mielőtt azokat speciális hardverekbe, például okosszemüvegekbe integrálnák. Ez a szakaszos megközelítés segíthet a Google-nek elkerülni a múltbeli hibákat, és olyan terméket fejleszteni, amely egyszerre technológiailag érett és társadalmilag elfogadható.
Az elkövetkező hónapok megmutatják, milyen gyorsan áll át a Google az okostelefonokon elérhető továbbfejlesztett Gemini Live funkciókról egy teljes értékű okosszemüveg-megoldásra. A Project Astra csapatának a Gemini csapatba való integrációjával járó szervezeti átszervezés e fejlődés felgyorsulását sugallja. A Gemini Live vizuális képességeinek 2025. március végén történő bevezetésével kulcsfontosságú alapok kerülnek lerakásra, megnyitva az utat a Google következő jelentős lépése előtt a viselhető mesterséges intelligencia technológiák fejlesztésében.
Alkalmas:
Az Ön globális marketing- és üzletfejlesztési partnere
☑️ Üzleti nyelvünk angol vagy német
☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!
Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.
Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein ∂ xpert.digital
Nagyon várom a közös projektünket.














