⭐️ Logistica / Intralogistica ⭐️ Intelligenza artificiale (AI) - Blog AI, Hotspot e Hub di contenuti ⭐️ Realtà aumentata e estesa - Ufficio / agenzia di pianificazione metaversa ⭐️ Xpaper

Selezione vocale 📢

Nuovo: Gemini Deep Research 2.0-Google Ki-Modell Upgrade Information su Gemini 2.0 Flash, Flash Thinking e Pro (Experimental)

Pubblicato il: 18 marzo 2025 / Aggiornamento dal 18 marzo 2025 - Autore: Konrad Wolfenstein

Aggiornamento del modello di AI di Google: Nuovo GEMINI 2.0-DEEP Research 2.0, Flash 2.0, Flash Thinking 2.0 e Pro 2.0 (sperimentale)-Image: Xpert.Digital

Ragionamento appena pensato: Gemini 2.0 solleva l'IA alla fase successiva

Gemini Deep Research 2.0

Gemini Deep Research 2.0 è stato accessibile a tutti gli utenti in tutto il mondo dal 13 marzo 2025. In questo giorno, Google ha annunciato l'ampia disponibilità di ricerche profonde, che ora lavora con il modello sperimentale di pensiero flash Gemini 2.0 migliorato.

Punti importanti per la disponibilità di Gemini Deep Research 2.0:

Ora può essere utilizzato gratuitamente in oltre 45 lingue senza abbonamento a pagamento.
Tutti gli utenti di Gemelli possono utilizzare una ricerca profonda gratuitamente più volte al mese.
Gli utenti avanzati di Gemini continuano ad avere accesso senza restrizioni alla funzione.
La versione mobile di Deep Research è stata introdotta il 18 febbraio 2025 per i dispositivi Android e iOS.

Con questa espansione, Google Deep Research ha reso accessibile a una base di utenti più ampia e quindi ha fatto un passo importante verso la democratizzazione degli strumenti di ricerca supportati dall'intelligenza artificiale.

Adatto a:

Ki Deep Research Strumenti nel test di indurimento: CHATGPT di OpenAI, Perplessità o Google Gemini 1.5 Pro?

GEMINI 2.0 Flash Thinking: lo sviluppo della ricerca e della personalizzazione dell'IA

Il recente salto nello sviluppo presso l'assistente AI di Google Gemini offre miglioramenti significativi in tre aree principali: ricerche profonde per tutti gli utenti, funzioni di personalizzazione estesa e ricorrenza più potente attraverso il pensiero flash 2.0. Queste innovazioni cambiano il modo in cui interagiamo con gli assistenti di intelligenza artificiale e gestiamo compiti di ricerca complessi.

Ricerca profonda: ricerca basata sull'intelligenza artificiale per tutti

La ricerca profonda, originariamente una funzionalità esclusiva per gli abbonati avanzati Gemini, è ora disponibile gratuitamente per tutti gli utenti in oltre 45 lingue. Questa potente funzione trasforma Gemelli in un assistente di ricerca personale che ricerca argomenti complessi in modo indipendente e riassume i risultati in report chiari e dettagliati.

Da Gemini 1.5 Pro a 2.0 pensiero flash

Il miglioramento decisivo è il cambio di Gemini 1.5 Pro al nuovo modello sperimentale di pensiero flash 2.0. Questo sistema utilizza una catena sofisticata di passaggi commemorativi per smontare problemi complessi in passaggi intermedi gestibili, che migliorano significativamente le capacità di ricerca in tutte le fasi, dalla pianificazione alle ricerche all'analisi e ai rapporti.

Il processo di ricerca in dettaglio

La ricerca profonda inizialmente trasforma la query di ricerca in un piano di ricerca personalizzato e multiplo. Dopo l'approvazione di questo piano da parte dell'utente, il sistema inizia a cercare autonomamente il Web e raccogliere informazioni pertinenti. Durante tutto il processo, Gemini affina continuamente la sua analisi ricercando in modo simile a una persona: trova informazioni interessanti e quindi avvia nuove ricerche in base a questi risultati.

La cosa speciale della ricerca profonda è la trasparenza del processo di pensiero: gli utenti possono comprendere le considerazioni del sistema e intervenire se necessario. Il risultato finale è un rapporto completo con conoscenze chiave e collegamenti alle fonti originali, che viene creata in pochi minuti e sostituisce ore di ricerca manuale.

Maggiore personalizzazione: Gemelli comprende le esigenze individuali

La seconda innovazione significativa è la funzione di personalizzazione sperimentale, che consente a Gemini di adattare le risposte in base ai dati personali delle app e dei servizi di Google.

Integrazione con l'ecosistema di Google

Con il consenso dell'utente, Gemini può accedere alla cronologia della ricerca e ad altri servizi di Google al fine di fornire risposte su misura. Il sistema utilizza questi dati per comprendere meglio le attività e le preferenze degli utenti e quindi fornire contenuti più pertinenti.

La personalizzazione inizia con l'integrazione di Google Search-Gemini può fornire raccomandazioni basate sulle precedenti domande di ricerca. Nel prossimo futuro, il sistema sarà anche in grado di trarre un contesto da altri servizi come Google Photos e YouTube, che consente una personalizzazione ancora più completa.

Protezione e controllo dei dati

Google sottolinea la gestione responsabile dei dati dell'utente: Gemini accede al corso di ricerca solo se queste informazioni sono considerate utili. La funzione è facoltativa e può essere disattivata in qualsiasi momento tramite un banner con il collegamento corrispondente. Questa funzione di personalizzazione è inizialmente disponibile per utenti avanzati Gemini e Gemini sul Web, con presto espansione ai dispositivi mobili.

2.0 Pensiero flash: il processo di pensiero trasparente

Il cuore di queste innovazioni è il modello sperimentale di pensiero flash 2.0, che è convinto di una migliore efficienza e velocità ed è ora disponibile anche per tutti gli utenti.

Trasparenza attraverso pensieri visibili

Una delle proprietà eccezionali del pensiero flash 2.0 è la capacità di rivelare il processo di pensiero. Il modello indica le sue considerazioni come "pensieri/pensieri" nella finestra di risposta, che consente una comprensione più profonda della funzione AI. Questo approccio di "ragionamento" significa che le risposte vengono controllate più volte prima dell'output, il che porta a risultati più precisi e affidabili.

Performance e portata

Il modello aggiornato offre impressionanti miglioramenti tecnici:

Una finestra di contesto con un milione di token per utenti avanzati Gemini che consente l'analisi di testi estesi
Supporto per carichi di file
Performance migliorate nei benchmark matematici e scientifici
Migliore coerenza tra pensieri e risposte

Integrazione con app e servizi

Un'estensione importante è il collegamento con le app Gemini (precedentemente chiamate Extensions), che consente l'accesso a servizi come Gmail, Google Calendar, Drive, Messaggi e YouTube. Questa integrazione consente richieste complesse e multi -passo in cui il modello registra il contesto generale, ha smantellato l'attività in singoli passaggi e valuta continuamente i progressi.

Nelle prossime settimane sarà disponibile anche un'app di Google Photos che offre le funzionalità "Chiedi foto" che gli utenti possono, ad esempio, avere le foto di un viaggio analizzate per creare un programma di viaggio o chiedere informazioni specifiche sulle immagini.

Un nuovo capitolo per gli assistenti di intelligenza artificiale

L'introduzione di una ricerca profonda per tutti gli utenti, combinata con le funzioni di personalizzazione estesa e il potente modello di pensiero flash 2.0, segna progressi significativi nello sviluppo degli assistenti di intelligenza artificiale. Google si posiziona a capo della competizione e rende le funzioni AI avanzate accessibili a un pubblico più ampio.

Queste innovazioni trasformano Gemelli da un semplice chat bot a un potente assistente personale che può gestire compiti di ricerca complessi, comprendere le esigenze individuali e rendere trasparente il suo pensiero. Integrando l'ecosistema di Google e una maggiore personalizzazione, Gemelli sta diventando sempre più una naturale espansione dell'utente, che anticipa le sue esigenze e offre supporto davvero su misura.

Adatto a:

Ki-Power da Google: AI Studio e Gemini-Questo è il modo in cui usi entrambi gli Riddles AI in modo ottimale.

Gemini 2.0: ulteriore sviluppo di Google Ki rispetto alle versioni precedenti

Con l'introduzione di Gemini 2.0, Google ha ulteriormente sviluppato la sua famiglia di modelli AI. La nuova generazione offre significativi miglioramenti di velocità, precisione e funzionalità alle versioni precedenti. Le differenze e le innovazioni più importanti di Gemini 2.0 sono analizzate in dettaglio rispetto alle versioni precedenti.

Miglioramenti delle prestazioni e differenze principali

Gemini 2.0 è risolto da numerosi miglioramenti fondamentali dai suoi predecessori. Il cambiamento più notevole è l'aumento della velocità: Gemini 2.0 Flash è circa il doppio di Gemini 1.5 Pro e lo supera in numerosi parametri di riferimento. Questo aumento della velocità va di pari passo con una precisione significativamente migliorata in vari compiti.

Anche la precisione in compiti complessi è stata significativamente aumentata. Ad esempio, Gemini 2.0 mostra una migliore precisione quando podcast e trascrizioni dettagliate. Inoltre, il modello genera edizioni più sfumate e contestuali, il che lo rende uno strumento più prezioso per la creazione di contenuti creativi e soluzioni problematiche complesse.

Un'altra innovazione importante è l'introduzione di competenze multimodali estese. Mentre Gemini ha già offerto 1,5 funzioni multimodali, Gemini 2.0 può non solo elaborare i dati di testo, immagine, audio e video, ma anche analizzare e comprendere molto più profondo.

Varianti del modello da Gemini 2.0

Google ha introdotto Gemini 2.0 in diverse varianti, ognuna delle quali è ottimizzata per applicazioni specifiche:

Gemini 2.0 Flash

Il modello di base è ora generalmente disponibile e offre limiti di tasso più elevati e prestazioni migliorate. È ideale per gli sviluppatori e può lavorare in modo efficiente con i dati audio, immagine, video e di testo. Il modello supporta una finestra di contesto di 1 milione di token.

Gemelli 2.0 per sperimentale

Questo è il modello più potente per compiti e codifica complessi. Ha una finestra di contesto estesa di 2 milioni di token-twice tanto quanto le varianti flash. Nei benchmark interni, Gemini 2.0 Pro raggiunge i migliori risultati in quasi tutte le aree.

Gemini 2.0 Flash-Lite

Una nuova variante economica, che offre ancora prestazioni migliorate rispetto al flash Gemini 1.5. È particolarmente interessante per gli sviluppatori che sono alla ricerca di una soluzione economica senza dover accettare perdite di prestazioni essenziali.

Gemini 2.0 Flash Thinking Experimental

Questo modello sperimentale utilizza un processo di pensiero aggiuntivo prima della generazione di risposte, simile a OpenAai O3 e DeepSeek-R1. Può anche accedere a strumenti esterni come YouTube, Maps e Google Search.

Competenze tecniche estese

Elaborazione multimodale

Le capacità multimodali di Gemini 2.0 sono molto più mature rispetto alle versioni precedenti. Il modello può anche elaborare e generare dati di testo, immagine e audio. Questa capacità consente applicazioni più complesse come la diagnostica medica, in cui può analizzare e collegare i rapporti e le procedure di imaging scritti.

Agenti autonomi e utilizzo degli strumenti

Gemini 2.0 introduce il concetto di agenti autonomi che possono svolgere compiti in modo indipendente prendendo decisioni e azioni di pianificazione. A Gemini 2.0 Flash, l'API live multimodale e l'uso dello strumento nativo sono particolarmente degni di nota, il che consente al modello di accedervi e utilizzarli su strumenti esterni.

Elaborazione della finestra e dei token di contesto

Un'importante differenza tecnica è la dimensione della finestra di contesto:

Gemini 2.0 Flash e Flash-Lite: 1 milione di token per l'input
Gemelli 2,0 per: 2 milioni di token per input
Tutti i modelli: 8.192 token per output

In confronto, Gemini 1,5 per quantità di dati è stato in grado di elaborare, tra cui 2 ore di video, 19 ore di audio, basi di codice con 60.000 righe di codice o 2.000 siti di testo.

Il benchmark risulta in confronto

In Benchmarks Gemini 2.0 mostra miglioramenti significativi rispetto alle versioni precedenti:

In compiti matematici, Gemini 2,0 per 91,8% nel Benchmark matematico e il 65,2% in Hiddenmath raggiunge significativamente più delle varianti flash. In OpenAis Simpleqa-Test, il modello Pro raggiunge il 44,3%, mentre Gemini 2.0 Flash arriva al 29,9%.

Il miglioramento è anche evidente nell'analisi di contenuti complessi. Quando si analizzano le immagini, Gemini 2.0 offre, ad esempio un'analisi più profonda e soluzioni pratiche rispetto alle versioni precedenti.

Integrazione e disponibilità

Tutti i modelli Gemini 2.0 sono disponibili su dispositivi desktop e mobili tramite Google AI Studio e Vertex AI, nonché su Google Chatbot Gemini Advanced. Una migliore integrazione con Google Services come Google Search, Maps e Workspace offre un'esperienza utente uniforme.

Le nuove funzioni sono anche accessibili agli sviluppatori, per cui Google è diventato più flessibile con i prezzi dell'API. Ad esempio, è stata annullata la precedente distinzione tra domande di contesto corto e lungo, che può contenere i costi per carichi di lavoro misti (testo e immagine) nonostante i miglioramenti delle prestazioni in base a quelli di Gemini 1.5 Flash.

Sviluppi futuri

Mentre Gemini 2.0 mostra già progressi significativi, va notato che alcune funzioni annunciate non sono ancora disponibili. In questo modo, l'edizione di immagine e audio e video live dovrebbero seguire per Flash e Pro nei prossimi mesi. Inoltre, il modello di punta "Gemini 2.0 Ultra" non è stato ancora annunciato.

Multimodale, veloce, intelligente: ciò che rende unica Gemini 2.0

Gemini 2.0 rappresenta un grande salto nell'evoluzione rispetto alle sue versioni predecessore. Ottimizza a Google una soluzione AI che è ottimizzata per un'ampia varietà di applicazioni a velocità migliorata, elaborazione multimodale ampliata, finestre di contesto più ampi e varianti di modello specializzate. L'integrazione degli agenti autonomi e dell'uso dello strumento nativo indicano un cambio di paradigma in cui i sistemi di intelligenza artificiale possono agire sempre più in modo indipendente e in modo intelligente.

Adatto a: