Hangválasztás 📢


A Google új AI -je most „mélyre gondolhat”: nem csupán válaszok - gyorsabb, okosabb és emberesebbnek hangzik, mint valaha

Megjelent: 2025. június 18 -án / Frissítés: 2025. június 18. - Szerző: Konrad Wolfenstein

A Google új AI -je most „mélyre gondolhat”: nem csupán válaszok - gyorsabb, okosabb és emberesebbnek hangzik, mint valaha

A Google új AI -je most „mélyre gondolhat”: nem csupán a válaszok - gyorsabb, okosabb, okosabb és emberesebbnek hangzik - Kép: Xpert.Digital

A Gemini 2.5 a Google -t az AI piacvezetővé teszi: Mit jelent ez a felhasználók számára

A Google bemutatja az új Gemini-2.5 modellt, és kibővíti a hozzáférést

A Google bejelentette a Gemini-2.5 modelljének jelentős előrelépését, és jelentősen kibővítette a legfejlettebb AI-technológiához való hozzáférést. A legújabb fejlemények fontos mérföldkövet jelölnek a Google AI stratégiájában, és a társaságot a mesterséges intelligencia vezető szolgáltatójaként helyezik el.

Alkalmas:

A Gemini 2.5 Flash és Pro általános rendelkezésre állása

2025. június 17 -én a Google kiadta a Gemini 2.5 Flash és a Pro stabil verzióját általános használatra. Ezek a modellek már nem szerepelnek a teszt szakaszában, és magabiztosan felhasználhatók a produktív alkalmazásokban. A fejlesztők és a vállalatok a modelleket a Google AI Studio és a Vertex AI segítségével használhatják, bár ezek szintén elérhetők a Gemini alkalmazásban.

Az általános rendelkezésre állás azt jelenti, hogy a Google hosszú távon támogatni fogja ezeket a modelleket, és ezek alkalmasak a skálázott gyártási alkalmazásokhoz. Az olyan cégek, mint a Spline, a Rooms, a Snap és a SmartBear, sikeresen dolgoztak a legújabb verziókkal az elmúlt hetekben.

Ikrek Bevezetése 2.5 Flash-Lite

A Gemini-2.5 család legújabb kiegészítéseként a Google Gemini 2.5 Flash-Lite bemutatta a költséghatékony és leggyorsabb modellt a 2.5 sorozatban. A Flash-Lite kezdetben előnézetként kapható, és olyan fejlesztőknek szól, akiknek nagy volumenű feladatokat kell elvégezniük, például fordításokat és osztályozásokat.

Az új modell lényegesen jobb minőséget kínál, mint a Gemini 2.0 Flash-Lite a programozás, a matematika, a természettudományok, a logikai gondolkodás és a multimodális referenciaértékek területén. Csak a teljes ár modellek költségeinek töredékét okozza, és alacsonyabb késleltetési időt kínál, mint elődei.

Bővített gondolkodási készségek és mély gondolkodás

A Gemini-2.5 modellek egyik legfontosabb jellemzője a fejlett „gondolkodási” képességeik. Ezek a gondolkodási modellek képesek átgondolni gondolataikat a válasz előtt, ami jobb teljesítményhez és nagyobb pontossághoz vezet. A „gondolkodási költségvetés” segítségével a fejlesztők ellenőrizhetik, hogy a modellnek intenzíven kell gondolkodniuk, mielőtt a választ generálná.

A Google bejelentette a Gemini 2.5 Pro kísérleti „Deep Think” módját is. Ez az üzemmód lehetővé teszi a modell számára, hogy több párhuzamos gondolkodási módot folytasson, mielőtt egy válasz lenne, amely különösen előnyös a komplex matematikai és programozási feladatokhoz. A tesztek során a Deep Think elérte a legjobb teljesítményt az amerikai matematikai olimpián, és 84% ​​-ot ért el az igényes MMMU referenciaértékben.

Új funkciók és fejlesztések

Natív hangkimenet és élő API

A Gemini 2.5 natív audio kimeneti funkciókat fogad, amelyek lehetővé teszik a természetes beszélgetéseket. A kibővített élő API támogatja az audiovizuális bejegyzéseket, és lehetővé teszi a közvetlen beszélgetéseket az AI -vel. A felhasználók ellenőrizhetik a hangot, az ékezetet és a kifejezést, és például azt mondhatják, hogy a modellnek drámai hangon kell olvasnia.

Az új kísérleti funkciók a következők:

  • Affektív párbeszéd: A modell felismeri az érzelmeket a hangban és ennek megfelelően a válaszokat
  • Proaktív hang: A háttérbeszélgetések automatikus szűrése
  • Szöveg-beszéd: Támogatás több hangszóró számára több mint 24 nyelven

Javított programozási készségek

A Gemini 2.5 Pro vezeti a Webdev Aréna rangsorolását, és jelentős javulást mutat a webfejlesztésben. A modell eléri a 63,8% -ot a Swe-Sench által ellenőrzött, az ágens alapú kódértékelések ipari szabványában. Kiváló szerepet játszik a vizuálisan vonzó webalkalmazások és az ügynöki alapú kódalkalmazások, valamint a kód-átalakítás és feldolgozás létrehozásakor.

A Video MM benchmark a lenyűgöző multimodális készségeket mutatja: a Gemini 2,5 Pro eléri a 84,8% -ot, szemben a Gemini 1,5 / 75% -ával és 71,9% -kal a GPT-4O-ban. Ez a képesség lehetővé teszi a teljes alkalmazások video -tartalomból történő létrehozását.

Bővített multimodalitás és kontextusfeldolgozás

A Gemini 2.5 a Gemini modellek erősségeire épül: natív multimodalitás és egy nagy kontextus ablak. A modell egy egymillió token kontextus ablakkal kezdődik, amelyben hamarosan 2 millió token lesz elérhető. Megérti a kiterjedt adatrekordokat, és szerkeszti a komplex problémákat a különböző információforrásokból, beleértve a szöveget, audio, képeket, videókat és a teljes kódraktárat.

Elérhetőség és hozzáférés

A fejlesztők számára

  • Google AI Studio: A kísérletek azonnali rendelkezésre állása
  • Vertex AI: Meghosszabbított funkciókkal rendelkező vállalatok számára elérhető
  • Ikrek API: Teljes integráció az SDK támogatással

A végfelhasználók számára

  • Ikrek alkalmazás: Elérhető az Ikrek Advanced felhasználók számára az asztalon és a mobilon
  • Google keresés: A Flash-Lite és a Flash speciálisan adaptált verziói

Oktatási szektor

A Google kiterjeszti a Google AI Pro-Plan ingyenes hozzáférését Brazília, Indonézia, Japán és Nagy-Britannia hallgatói számára a 2026-os záróvizsgara. Az AI támogatáson kívül a csomag 2 TB-tárolóhelyet és a NotebookKLM-et is tartalmaz.

Alkalmas:

Műszaki előírások és teljesítmény

A Gemini 2.5 Pro egyértelmű távolságra vezeti az Lmarena rangsorolást, és különféle referenciaértékekben mutatja be az állami szolgáltatásokat. A modell eléri a 18,8% -ot a „Humanity utolsó vizsga” -nál, egy olyan adatkészletnél, amelyet több száz szakértő fejlesztett ki annak érdekében, hogy megértse a tudás és a logikai gondolkodás emberi határait.

A Gemini 2.5 Pro legújabb verziója egy 24 pontos Elo ugrást mutat az Lmarena-on és egy 35 pontos Elo ugrást a Webdevarán. Ez továbbra is olyan nehéz programozási referenciaértékekhez vezet, mint például Aider Polyglot, és megmutatja a GPQA és más igényes matematikai és tudományos áttekintéseket.

A Google Gemini 2.5 Flash és a Per Transform az AI tájat stabil verziókkal

A Gemini 2.5 Flash és Pro stabil verzióinak bevezetése, valamint a Flash-Lite előnézete fontos lépést jelez a Google AI fejlesztésében. A jobb teljesítmény, a kibővített funkciók és a szélesebb hozzáférés kombinációjával a Google a mesterséges intelligencia területén vezető szolgáltatóként helyezkedik el.

A folyamatos fejlesztések és a rendelkezésre állás kibővítése azt mutatja, hogy a Google elkötelezettsége az AI technológia hozzáférhetőbbé és hatékonyabbá tétele érdekében a fejlesztők, a vállalatok és a végfelhasználók számára. Az új gondolkodási képességekkel és a jobb multimodalitással a Gemini 2.5 új szabványokat állít fel az AI alkalmazások következő generációjára.

Alkalmas:

 

Az Ön globális marketing- és üzletfejlesztési partnere

☑️ Üzleti nyelvünk angol vagy német

☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!

 

Digitális úttörő – Konrad Wolfenstein

Konrad Wolfenstein

Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.

Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein xpert.digital

Nagyon várom a közös projektünket.

 

 

☑️ KKV-k támogatása stratégiában, tanácsadásban, tervezésben és megvalósításban

☑️ Digitális stratégia és digitalizáció megalkotása vagy átrendezése

☑️ Nemzetközi értékesítési folyamatok bővítése, optimalizálása

☑️ Globális és digitális B2B kereskedési platformok

☑️ Úttörő üzletfejlesztés / Marketing / PR / Szakkiállítások


⭐️ Mesterséges intelligencia (AI) – AI blog, hotspot és tartalomközpont ⭐️ XPaper