Pubblicato il: 9 marzo 2025 / Aggiornamento dal: 9 marzo 2025 - Autore: Konrad Wolfenstein
Strategia di occhiali intelligenti di Google con Project Astra e Gemini Live: The New Era of Visual AI Assistance da Google-Image: Xpert.Digital
Gli occhiali intelligenti resi diversi: la visione di Google per una nuova era di tecnologia
Paradigm Shift in vista: la via di Google alla intelligenza intelligente nella vita di tutti i giorni
Google è sulla soglia di una significativa evoluzione tecnologica nell'area della tecnologia portatile. Gli ultimi sviluppi in Gemini Live, combinati con piani concreti per nuovi occhiali intelligenti, indicano un prossimo turno di paradigma che potrebbe fondamentalmente cambiare il modo in cui interagiamo con l'intelligenza artificiale. L'integrazione delle capacità di riconoscimento visivo in Gemini Live on Smartphone costituisce le basi tecnologiche per le prossime soluzioni Smart Glass e segna una svolta strategica nella visione di Google per l'onnipresente assistenza all'intelligenza artificiale nella vita di tutti i giorni.
Adatto a:
- Conversazione con Gemini Live: AI conversazionale di Google per le interazioni del linguaggio naturale
Il secondo tentativo: il ritorno di Google al mercato degli occhiali intelligenti
Il primo tentativo di Google nell'area degli occhiali intelligenti è stato di oltre un decennio. Google Glass, presentato nel 2012 e ha interrotto i consumatori nel 2015, è stato in anticipo sui tempi in molti modi. Con un peso di soli 42 grammi, gli occhiali erano relativamente leggeri, ma soffrivano di restrizioni pratiche come una durata a bassa batteria di sole due o tre ore - chiaramente troppo poco per una giornata lavorativa produttiva. Inoltre, l'elemento decisivo mancava al momento in cui gli occhiali intelligenti di oggi potevano rendere rivoluzionaria: AI generativa avanzata.
Dopo il fallimento commerciale di Google Glass, la società si è concentrata sulle applicazioni aziendali, ma in gran parte si è ritirata dal mercato dei consumatori. Nel frattempo, la tecnologia stessa si è sviluppata continuamente. L'acquisizione di North, un produttore di occhiali intelligenti focali, ha già indicato un continuo interesse per questa categoria di prodotti alcuni anni fa. I nuovi occhiali intelligenti, che Google sta ora sviluppando, dovrebbero essere significativamente più sottili e più comodi dei focali e quindi tengono conto delle lezioni delle generazioni precedenti.
I rapporti attuali mostrano che Google è in trattative con produttori di occhiali consolidati come Esilorluxottica, che include anche Ray-Ban. Questa decisione strategica potrebbe aiutare Google a evitare uno dei principali problemi di Google Glass: la mancanza di accettazione alla moda. Ray-Ban ha già esperienza con occhiali da sole intelligenti attraverso la sua collaborazione con Meta. Queste partnership potrebbero essere cruciali per posizionare i nuovi occhiali intelligenti come accessorio di moda anziché come una dimostrazione tecnologica sorprendente.
Adatto a:
- Occhiali smart: il ritorno dei Google Glass 2.0? Ritorno al futuro con la realtà aumentata ricaricata
Progetto Astra: la base per l'assistente di AI Visual di Google
Al centro della strategia Smart Glasses di Google c'è "Project Astra", un progetto di ricerca ambizioso per lo sviluppo di un assistente universale di AI visivo. Google ha dimostrato il progetto Astra per la prima volta alla conferenza degli sviluppatori I/O nel maggio 2024 e ha mostrato un'impressionante dimostrazione tecnica che illustrava il potenziale dell'assistenza visiva dell'IA.
In una significativa ristrutturazione organizzativa, Google ha recentemente integrato il team dietro Project Astra sotto il tetto del team Gemini. Questa fusione sottolinea l'importanza centrale dei Gemelli per la visione di Google degli occhiali intelligenti e mostra che entrambe le tecnologie sono viste come parte di una strategia uniforme. Il team di Astra deve lavorare specificamente sulle funzionalità dal vivo all'interno del team Gemini e quindi amplia ulteriormente la componente visiva dei Gemelli.
Le basi tecnologiche del progetto Astra sono progredita notevolmente. Contrariamente a Google Glass, che era più visione del futuro di un prodotto maturo un decennio fa, Project Astra si basa su possibilità tecniche realistiche che sono già disponibili oggi. La dimostrazione su Google I/O ha mostrato come un utente può guardare l'ambiente circostante attraverso gli occhiali intelligenti e allo stesso tempo parlarne con un assistente di intelligenza artificiale. Ciò che è stato considerato un pio desiderio di undici anni fa è tecnicamente realizzabile oggi.
Gemelli Live: il ponte tra smartphone e occhiali intelligenti
Gli ultimi sviluppi di Gemini Live formano un ponte decisivo tra le attuali applicazioni per smartphone e i prossimi occhiali intelligenti. Nel marzo 2025, Google annunciò estensioni significative per Gemini Live, che soprattutto migliorano le capacità visive dell'assistente di AI.
Le nuove funzioni includono input video in diretta e rilascio dello schermo, il che significa che gli utenti con Gemini possono parlare di ciò che vedono in tempo reale. Queste funzioni sono supportate da Gemini 2.0 Flash, una versione del modello multimodale, che è stata appositamente ottimizzata per applicazioni mobili veloci. Dalla fine di marzo 2025, queste funzioni per gli abbonati avanzati Gemini saranno disponibili su dispositivi Android nell'ambito del piano premium di Google One AI.
La funzionalità di queste nuove abilità è notevolmente intuitiva: gli utenti possono puntare la fotocamera per smartphone su un oggetto interessante e chiedere direttamente Gemini. L'assistente AI analizza l'immagine video in tempo reale e fornisce informazioni relative al contesto. Gli utenti possono anche rilasciare lo schermo per Gemini e discutere ciò che vedono durante l'interazione dello smartphone con il bot AI.
Queste funzioni non devono solo essere considerate come funzionalità di smartphone isolate, ma piuttosto come un precursore diretto della funzionalità pianificata degli occhiali intelligenti. Google stesso stabilisce chiaramente questa connessione: "Gemini Live con il suo componente visivo è praticamente la superficie che Google vorrà presto utilizzare per gli occhiali intelligenti". La differenza decisiva tra l'applicazione dello smartphone e gli occhiali intelligenti alla fine consiste solo se la visualizzazione dello smartphone o l'immagine della fotocamera di uno occhiali intelligenti viene rilasciata: la base è tecnologicamente identica.
I prossimi occhiali intelligenti di Google
I nuovi occhiali intelligenti di Google dovrebbero essere un ulteriore sviluppo significativo rispetto agli esperimenti precedenti. Gemelli fungerà da elemento centrale e sono costantemente disponibili per gli utenti sia per audio che per visivo. Il campo visivo dell'utente deve essere rilasciato permanentemente per Gemelli, il che significa che il bot AI può praticamente interagire con l'utente nel mondo reale.
Come parte del progetto "Gemini Sight", che è stato presentato per la competizione per sviluppatori API Gemini, sono stati presentati concetti per gli occhiali intelligenti supportati dall'intelligenza artificiale, che potrebbero aiutare le persone in particolare le persone cieche e ipovedenti. Questi vetri intelligenti rivoluzionari alimentati dall'intelligenza artificiale dovrebbero integrarsi perfettamente nei servizi di Google e automatizzare una varietà di attività tramite semplici comandi vocali da una gestione del calendario per inviare e-mail alle prenotazioni del ristorante.
Una cerchia selezionata di persone ha già avuto l'opportunità di acquisire esperienze pratiche con gli occhiali Gemini AI. I rapporti indicano che gli occhiali offrono effettivamente l'esperienza di Google Glass che Google non poteva realizzare oltre un decennio fa. I progressi tecnologici, specialmente nell'area dell'intelligenza artificiale generativa, lo rendono possibile oggi, che all'epoca era ancora la musica futura.
Integrazione con Servizi Google e competenze multimodali
Un aspetto centrale dei prossimi occhiali intelligenti è la loro integrazione completa con i servizi Google esistenti. Gemini può già essere collegato a numerose app e servizi di Google, tra cui Gmail, Google Drive, Google Documenti, Google Maps, YouTube, Google Voli e Google Hotels. Questi collegamenti consentono all'Assistente di trovare informazioni pertinenti più velocemente e di automatizzare compiti complessi.
Le abilità multimodali di Gemelli Live sono continuamente ampliate. Originariamente disponibile solo in inglese, Gemini ora supporta oltre 45 lingue, tra cui il tedesco. Questa versatilità linguistica è un passo importante verso il lancio del mercato globale degli occhiali intelligenti. La capacità di avere conversazioni in un massimo di due lingue sullo stesso dispositivo e persino cambiare la lingua nel mezzo della frase è particolarmente notevole.
Le abilità visive di Gemini Live vanno ben oltre la semplice analisi delle immagini. Gli utenti possono caricare foto o guardare video di YouTube e parlarne contemporaneamente con Gemini. Con i video, Gemini può riassumere il contenuto e rispondere alle domande al riguardo, ad esempio per una revisione del prodotto su YouTube. Con i file PDF, l'intelligenza artificiale non può solo riassumere e chiarire le domande, ma persino creare quiz per testare la conoscenza degli utenti.
Adatto a:
- I vantaggi della modalità AI di Google rispetto ad altri prodotti di ricerca AI come la perplessità AI e la ricerca su GHATGPT di Openai
Potenziale di mercato ed effetti sociali
Il potenziale di mercato per gli occhiali intelligenti a base di intelligenza artificiale è enorme. Mentre Google Glass non è riuscito principalmente a causa di problemi di protezione dei dati e applicabilità pratica, l'integrazione di Gemini potrebbe in parte superare queste sfide. I casi pratici di applicazione sono diversi e vanno dagli aiuti quotidiani a applicazioni professionali specializzate ai sistemi di assistenza per le persone con disabilità.
Tuttavia, rimangono domande importanti, specialmente nell'area della protezione dei dati. Le parti permanenti del campo visivo con un'intelligenza artificiale sollevano nuove questioni etiche e legali che Google deve affrontare per ottenere un'accettazione più ampia che su Google Glass. La cooperazione con i produttori di occhiali consolidati potrebbe aiutare a rendere la tecnologia più sottile e socialmente accettabile.
Google è in una concorrenza intensiva con altre aziende tecnologiche nel campo della realtà ampliata. Mentre Apple si basa su una soluzione XR più completa con Vision Pro, Google si concentra su una forma più leggera e più quotidiana di realtà aumentata con gli occhiali intelligenti. Google ha anche annunciato lo sviluppo di Android XR, una piattaforma che ha lo scopo di supportare sia gli occhiali intelligenti che gli occhiali VR più completi.
I gemelli vivono come presagio di una nuova era di interazione umana-ki
L'integrazione delle abilità visive in Gemini Live segna un passo decisivo nella visione a lungo termine a lungo termine di Google per assistenza onnipresente. Ciò che inizia sugli smartphone probabilmente troverà il suo picco nei prossimi occhiali intelligenti. Le basi tecnologiche sono già disponibili e Google utilizza la diffusa distribuzione degli smartphone come campo di prova per le funzioni che devono essere implementate in seguito in occhiali intelligenti.
Lo sviluppo di Gemini Live illustra l'approccio strategico di Google: le nuove funzioni di intelligenza artificiale vengono inizialmente introdotte, testate e ottimizzate sugli smartphone prima di essere integrati in hardware specializzati come gli occhiali intelligenti. Questa procedura di fase -Sep potrebbe aiutare Google a evitare gli errori del passato e sviluppare un prodotto che è sia tecnologicamente maturo che socialmente accettato.
I prossimi mesi mostreranno la rapidità con cui Google passerà dalle funzioni estese di Gemini Live agli smartphone a una soluzione di vetro intelligente a pieno titolo. La ristrutturazione organizzativa con l'integrazione del team del progetto Astra nel team Gemini indica un'accelerazione di questo sviluppo. Con l'introduzione delle funzioni visive di Gemini Live alla fine di marzo 2025, vengono create importanti basi che apriranno la strada al prossimo grande passo di Google nello sviluppo di tecnologie di intelligenza artificiale portatili.
Adatto a:
Il tuo partner globale per il marketing e lo sviluppo aziendale
☑️ La nostra lingua commerciale è l'inglese o il tedesco
☑️ NOVITÀ: corrispondenza nella tua lingua nazionale!
Sarei felice di servire te e il mio team come consulente personale.
Potete contattarmi compilando il modulo di contatto o semplicemente chiamandomi al numero +49 89 89 674 804 (Monaco) . Il mio indirizzo email è: wolfenstein ∂ xpert.digital
Non vedo l'ora di iniziare il nostro progetto comune.