Výběr hlasu 📢


Nová AI společnosti Google může nyní „myslet hluboko“: Více než jen odpovědi - rychlejší, chytřejší a zní lidštější než kdy jindy

Publikováno dne: 18. června 2025 / Aktualizace od: 18. června 2025 - Autor: Konrad Wolfenstein

Nová AI společnosti Google může nyní „myslet hluboko“: Více než jen odpovědi - rychlejší, chytřejší a zní lidštější než kdy jindy

Nová AI společnosti Google může nyní „myslet hluboko“: Více než jen odpovědi - rychlejší, chytřejší, chytřejší a zní lidštější než kdy jindy - obrázek: xpert.digital

Gemini 2.5 dělá společnost Google lídrem na trhu AI: Co to znamená pro uživatele

Google představuje nový model Gemini-2.5 a rozšiřuje přístup

Společnost Google oznámila významný pokrok ve svém modelu Gemini-2,5 a výrazně rozšířil přístup k nejmodernější technologii AI. Nejnovější vývoj znamená důležitý milník ve strategii AI Google a postaví společnost jako přední poskytovatel v oblasti umělé inteligence.

Vhodné pro:

Obecná dostupnost Gemini 2.5 Flash a Pro

17. června 2025 vydala Google stabilní verzi Gemini 2.5 Flash a Pro pro obecné použití. Tyto modely již nejsou ve zkušební fázi a lze je s jistotou používat v produktivních aplikacích. Vývojáři a společnosti mohou modely používat prostřednictvím Google AI Studio a Vertex AI, i když jsou také k dispozici v aplikaci Gemini.

Obecná dostupnost znamená, že Google tyto modely bude dlouhodobě podporovat a že jsou vhodné pro upravené výrobní aplikace. Společnosti jako SPLINE, Rooms, Snap a SmartBear úspěšně spolupracovaly s nejnovějšími verzemi v posledních několika týdnech.

Úvod Gemini 2.5 Flash-Lite

Jako nejnovější přírůstek do rodiny Gemini-2,5 představil Google Gemini 2.5 Flash-Lite nákladově efektivní a nejrychlejší model v řadě 2.5. Flash-Lite je zpočátku k dispozici jako náhled a je zaměřen na vývojáře, kteří musí provádět úkoly s vysokým objemem, jako jsou překlady a klasifikace.

Nový model nabízí výrazně lepší kvalitu než Flash-Lite Gemini 2.0 v oblasti programování, matematiky, přírodních věd, logického myšlení a multimodálních benchmarků. Způsobuje pouze zlomek nákladů na modely plné ceny a nabízí nižší časy latence než jeho předchůdci.

Rozšířené dovednosti myšlení a hluboké myšlení

Klíčovým rysem modelů Gemini-2,5 jsou jejich pokročilé „myšlení“ dovednosti. Tyto modely myšlení jsou schopny promyslet své myšlenky před odpovědí, což vede ke zlepšení výkonu a větší přesnosti. S „rozpočty na myšlení“ mohou vývojáři zkontrolovat, jak intenzivně by měl model myslet, než vygeneruje odpověď.

Google také oznámil experimentální režim „Deep Think“ pro Gemini 2.5 Pro. Tento režim umožňuje modelu sledovat několik způsobů myšlení paralelně dříve, než bude odpověď, která je obzvláště výhodná pro komplexní matematické a programovací úkoly. V testech dosáhl Deep Think nejvyšší výkon na americké matematické olympiádě 2025 a dosáhl 84% v náročném měřítku MMMU.

Nové funkce a vylepšení

Nativní zvukový výstup a živé API

Gemini 2.5 dostává funkce nativního zvukového výstupu, které umožňují přirozenější konverzace. Rozšířené živé API podporuje audiovizuální položky a umožňuje přímé konverzace s AI. Uživatelé mohou ovládat tón, přízvuk a výraz a například říkají model, že by měl číst příběhy dramatickým tónem.

Nové experimentální funkce zahrnují:

  • Afektivní dialog: Model rozpoznává emoce hlasem a odpovídajícím způsobem odpovídá
  • Proaktivní zvuk: Automatické filtrování rozhovorů na pozadí
  • Text-to-řeč: Podpora několika reproduktorů ve více než 24 jazycích

Vylepšené programovací dovednosti

Gemini 2.5 Pro vede hodnocení WebDev Arena a ukazuje významná zlepšení vývoje webu. Model dosáhne 63,8% v ověřeném SWE-Bench, průmyslový standard pro hodnocení kódu založeného na agentech. Vyniká při vytváření vizuálně přitažlivých webových aplikací a aplikací založených na agentech a také transformaci a zpracování kódu.

Video MM Benchmark ukazuje působivé multimodální dovednosti: Gemini 2.5 Pro dosahuje 84,8% ve srovnání se 75% v Gemini 1,5 za a 71,9% v GPT-4o. Tato schopnost umožňuje vytvářet celé aplikace z videoobsahu.

Rozšířená multimodalita a zpracování kontextu

Gemini 2.5 staví na silných stránkách modelů Gemini: nativní multimodalita a velké kontextové okno. Model začíná kontextovým oknem 1 milionu tokenů, přičemž 2 miliony tokenů budou brzy k dispozici. Může porozumět rozsáhlým datovým záznamům a úpravy složitých problémů z různých zdrojů informací, včetně textu, zvuku, obrázků, videí a celých repozitářů kódu.

Dostupnost a přístup

Pro vývojáře

  • Studio Google AI: Okamžitá dostupnost pro experimenty
  • Vertex AI: K dispozici pro společnosti s rozšířenými funkcemi
  • Gemini API: Kompletní integrace s podporou SDK

Pro koncové uživatele

  • Aplikace Gemini: K dispozici pro pokročilé uživatele Gemini na ploše a mobilu
  • Vyhledávání Google: Speciálně přizpůsobené verze Flash-Lite a Flash

Vzdělávací sektor

Google rozšiřuje volný přístup k Planu Google AI pro studenty v Brazílii, Indonésii, Japonsku a Velké Británii na závěrečné zkoušky 2026. Kromě podpory AI zahrnuje balíček také 2 úložný prostor TB a notebookKLM.

Vhodné pro:

Technické specifikace a výkon

Gemini 2.5 Pro vede hodnocení Lmarena na jasné vzdálenosti a ukazuje státní služby v různých benchmarcích. Model dosahuje 18,8% na „Poslední zkoušce lidstva“, datové sadě vyvinuté stovkami odborníků, aby se pochopila limit lidského znalostí a logického myšlení.

Nejnovější verze Gemini 2.5 Pro ukazuje 24-bodový Elo Jump na Lmarena a 35-bodový Elo Jump na Webdevara. Nadále vede k obtížným měřítkům programování, jako je Aider Polyglot, a ukazuje špičkový výkon v GPQA a další náročné matematické a vědecké recenze.

Google Gemini 2.5 Flash a na transformaci AI krajiny se stabilními verzemi

Zavedení stabilních verzí Gemini 2.5 Flash a PRO, jakož i náhled Flash-Lite označí důležitý krok ve vývoji AI Google. S kombinací zlepšeného výkonu, rozšířených funkcí a širšího přístupu se Google postaví jako přední poskytovatel v oblasti umělé inteligence.

Neustálá zlepšení a rozšíření dostupnosti ukazují závazek společnosti Google, aby byla technologie AI přístupnější a efektivnější pro vývojáře, společnosti a koncové uživatele. S novými dovednostmi myšlení a vylepšenou multimodalita stanoví Gemini 2.5 nové standardy pro příští generaci aplikací AI.

Vhodné pro:

 

Váš globální partner pro marketing a rozvoj podnikání

☑️ Naším obchodním jazykem je angličtina nebo němčina

☑️ NOVINKA: Korespondence ve vašem národním jazyce!

 

Digitální průkopník - Konrad Wolfenstein

Konrad Wolfenstein

Rád vám a mému týmu posloužím jako osobní poradce.

Kontaktovat mě můžete vyplněním kontaktního formuláře nebo mi jednoduše zavolejte na číslo +49 89 89 674 804 (Mnichov) . Moje e-mailová adresa je: wolfenstein xpert.digital

Těším se na náš společný projekt.

 

 

☑️ Podpora MSP ve strategii, poradenství, plánování a implementaci

☑️ Vytvoření nebo přeladění digitální strategie a digitalizace

☑️ Rozšíření a optimalizace mezinárodních prodejních procesů

☑️ Globální a digitální obchodní platformy B2B

☑️ Pioneer Business Development / Marketing / PR / Veletrhy


⭐️ Umělá inteligence (AI) – AI blog, hotspot a centrum obsahu ⭐️ XPaper