Webbplatsikon Xpert.digital

Googles nya AI kan nu "tänka djupt": mer än bara svar - snabbare, smartare och låter mer mänskligt än någonsin

Googles nya AI kan nu "tänka djupt": mer än bara svar - snabbare, smartare och låter mer mänskligt än någonsin

Googles nya AI kan nu "tänka djupt": mer än bara svar - snabbare, smartare, smartare och låter mer mänskligt än någonsin - Bild: Xpert.digital

Gemini 2.5 gör Google till AI -marknadsledaren: Vad detta betyder för användare

Google introducerar ny Gemini-2,5-modell och utvidgar åtkomst

Google har meddelat betydande framsteg i sin Gemini-2,5-modell och utökat åtkomsten till sin mest avancerade AI-teknik. Den senaste utvecklingen markerar en viktig milstolpe i Googles AI -strategi och positionerar företaget som en ledande leverantör inom konstgjord intelligens.

Lämplig för detta:

Allmän tillgänglighet av Gemini 2.5 Flash och Pro

Den 17 juni 2025 släppte Google den stabila versionen av Gemini 2.5 Flash och Pro för allmänt bruk. Dessa modeller är inte längre i testfasen och kan användas säkert i produktiva applikationer. Utvecklare och företag kan använda modellerna via Google AI Studio och Vertex AI, även om de också är tillgängliga i Gemini -appen.

Den allmänna tillgängligheten innebär att Google kommer att stödja dessa modeller på lång sikt och att de är lämpliga för skalade produktionsapplikationer. Företag som spline, rum, Snap och SmartBear har framgångsrikt arbetat med de senaste versionerna under de senaste veckorna.

Introduktion av Gemini 2.5 Flash-Lite

Som det senaste tillskottet till Gemini-2,5-familjen har Google Gemini 2.5 Flash-Lite presenterat den kostnadseffektiva och snabbaste modellen i 2.5-serien. Flash-Lite är initialt tillgängligt som en förhandsgranskning och riktar sig till utvecklare som måste utföra uppgifter med hög volym som översättningar och klassificeringar.

Den nya modellen erbjuder betydligt bättre kvalitet än Gemini 2.0 Flash-Lite inom områdena programmering, matematik, naturvetenskap, logiskt tänkande och multimodala riktmärken. Det orsakar bara en bråkdel av kostnaderna för de fulla prismodellerna och erbjuder lägre latenstider än föregångarna.

Utökade tänkande färdigheter och djupt tänk

En viktig funktion i Gemini-2,5-modellerna är deras avancerade "tänkande" färdigheter. Dessa tänkande modeller kan tänka igenom sina tankar innan svaret, vilket leder till förbättrad prestanda och större noggrannhet. Med "tänkande budgetar" kan utvecklare kontrollera hur intensivt modellen ska tänka innan den genererar ett svar.

Google har också meddelat ett experimentellt "Deep Think" -läge för Gemini 2.5 Pro. Detta läge gör det möjligt för modellen att fortsätta flera sätt att tänka parallellt innan det finns ett svar, vilket är särskilt fördelaktigt för komplexa matematiska och programmeringsuppgifter. I tester uppnådde Deep Think toppprestanda i USA: s matematik OS 2025 och uppnådde 84% i det krävande MMMU -riktmärket.

Nya funktioner och förbättringar

Native Audio Output och Live API

Gemini 2.5 får inbyggda ljudutgångsfunktioner som möjliggör mer naturliga konversationer. Det utökade LIVE API stöder audiovisuella poster och möjliggör direkta samtal med AI. Användare kan kontrollera tonen, accenten och uttrycket och till exempel säga modellen att den ska läsa historier i en dramatisk ton.

De nya experimentfunktionerna inkluderar:

  • Affektiv dialog: Modellen känner igen känslor i rösten och svarar i enlighet därmed
  • Proaktivt ljud: Automatisk filtrering av bakgrundssamtal
  • Text-till-tal: Support för flera högtalare på över 24 språk

Förbättrade programmeringsfärdigheter

Gemini 2.5 Pro leder Webdev Arena -rankingen och visar betydande förbättringar i webbutvecklingen. Modellen når 63,8% i Swe-Bench verifierad, den industriella standarden för agentbaserade kodutvärderingar. Det utmärkt sig när man skapar visuellt tilltalande webbappar och agentbaserade kodapplikationer samt kodomvandling och bearbetning.

Video MM Benchmark visar de imponerande multimodala färdigheterna: Gemini 2.5 Pro når 84,8% jämfört med 75% i Gemini 1,5 per och 71,9% i GPT-4O. Denna förmåga gör det möjligt att skapa hela applikationer från videoinnehåll.

Utökad multimodalitet och kontextbehandling

Gemini 2.5 bygger på styrkorna hos Gemini -modellerna: Native multimodalitet och ett stort sammanhangsfönster. Modellen börjar med ett fönster på 1 miljon token, varvid 2 miljoner tokens kommer att finnas tillgängliga inom kort. Det kan förstå omfattande dataposter och redigera komplexa problem från olika informationskällor, inklusive text, ljud, bilder, videor och hela kodförvar.

Tillgänglighet och tillgång

För utvecklare

  • Google AI Studio: Omedelbar tillgänglighet för experiment
  • Vertex AI: Tillgänglig för företag med utökade funktioner
  • Gemini API: Komplett integration med SDK -stöd

För slutanvändare

  • Gemini -app: Tillgänglig för Gemini Advanced -användare på skrivbord och mobil
  • Google Search: Speciellt anpassade versioner av Flash-Lite och Flash

Utbildningsområde

Google utvidgar den fria tillgången till Google AI Pro-plan för studenter i Brasilien, Indonesien, Japan och Storbritannien till de slutliga tentamen 2026. Förutom AI-stöd inkluderar paketet också 2 TB lagringsutrymme och NoteBookKLM.

Lämplig för detta:

Tekniska specifikationer och prestanda

Gemini 2.5 Pro leder LMarena -rankingen på ett tydligt avstånd och visar statliga tjänster i olika riktmärken. Modellen når 18,8% vid ”Humanity's Last Exam”, ett datasätt utvecklat av hundratals experter för att förstå den mänskliga kunskapsgränsen och logiskt tänkande.

Den senaste versionen av Gemini 2.5 Pro visar ett 24-punkts ELO-hopp på LMarena och ett 35-punkts ELO-hopp på WebDeara. Det fortsätter att leda till svåra programmering av riktmärken som Aider Polyglot och visar toppprestanda i GPQA och andra krävande matematiska och vetenskapliga recensioner.

Google Gemini 2.5 Flash och per omvandla AI -landskapet med stabila versioner

Införandet av de stabila versionerna av Gemini 2.5 Flash och Pro samt förhandsgranskningen av Flash-Lite Mark ett viktigt steg i Googles AI-utveckling. Med kombinationen av förbättrad prestanda, utvidgade funktioner och bredare åtkomst positionerar Google sig som en ledande leverantör inom konstgjord intelligens.

De kontinuerliga förbättringarna och utvidgningen av tillgängligheten visar Googles åtagande att göra AI -teknik mer tillgänglig och effektiv för utvecklare, företag och slutanvändare. Med de nya tänkande färdigheter och förbättrad multimodalitet sätter Gemini 2.5 nya standarder för nästa generation av AI -applikationer.

Lämplig för detta:

 

Din globala marknadsförings- och affärsutvecklingspartner

☑ Vårt affärsspråk är engelska eller tyska

☑ Nytt: korrespondens på ditt nationella språk!

 

Konrad Wolfenstein

Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.

Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein xpert.digital

Jag ser fram emot vårt gemensamma projekt.

 

 

☑ SME -stöd i strategi, rådgivning, planering och implementering

☑ skapande eller omjustering av den digitala strategin och digitaliseringen

☑ Expansion och optimering av de internationella försäljningsprocesserna

☑ Globala och digitala B2B -handelsplattformar

☑ Pioneer Business Development / Marketing / PR / Measure

Lämna den mobila versionen