A CHATGPT szuper-KI-ügynökévé válik: Openai új AI modellje, O3 és O4-Mini Gondolj most!

Megjelent: 2025. április 17. / Frissítés: 2025. április 17. - Szerző: Konrad Wolfenstein

A CHATGPT szuper-KI-ügynökévé válik: Openai új AI modellje, O3 és O4-Mini Gondolj most! - Kép: xpert.digital

Intelligensebb, mint valaha: az Openaai O sorozatát új készségekkel lenyűgözte

Matematika, programozás és még sok más: Az Openai O4-Mini az új AI Wonder Child! - Az Openai O3 megérti a képeket és megoldja a problémákat, mint még soha!

2025. április 16-án az Openai két új AI modellt mutatott be az O-Serious-O3 és O4-Mini-ben. Ezeket a vállalat leg intelligensebb és legerősebb modelljeinek nevezik. Az új rendszereket a továbbfejlesztett gondolkodási készségek jellemzik, és először használhatják és kombinálhatják a Chattban elérhető összes eszközt. Különösen képzettek voltak arra, hogy hosszabb ideig gondolkodjanak a válaszgenerálás előtt, ami különösen hatékonysá teszi őket olyan összetett feladatokban, mint a programozás, a matematika és a vizuális elemzés.

Alkalmas:

A chatgpt memóriát kap, és most mindent (szinte) emlékszik: az új memória funkció részletesen

Az új O-Series modellek egy pillanat alatt

Alapvető tulajdonságok és készségek

Az Openai O-sorozata paradigmaváltást jelent az AI fejlődésben. A modelleket megerősítő tanulással kiképezték annak érdekében, hogy hosszabb gondolkodási folyamatokat végezzenek a válasz generálása előtt. Ez a megközelítés lehetővé teszi a modellek számára, hogy kipróbálhassák a különböző megoldási stratégiákat, felismerjék a hibákat és szétszereljék a komplex problémákat az egyszerűbb aljogokba.

Az O3 és az O4-MINI jelentős innovációja az a képesség, hogy az összes rendelkezésre álló chatt-eszközt függetlenül és ügynök-alapú felhasználhassa. Ez magában foglalja a webes keresést, a python-alapú adatelemzést, a képfeldolgozást, a képgenerálást, a vászon, az automatizálás, a fájlkeresés és a memóriafunkciókat. Ezeket az eszközöket közvetlenül a modellek gondolkodási folyamatába integrálják képességeik bővítése és a bonyolultabb feladatok kezelése érdekében.

A modellek maguknak dönthetnek arról, hogy mikor és hogyan használják a legjobban ezeket az eszközöket, és általában kevesebb, mint egy perc alatt adnak válaszokat, még bonyolultabb problémákkal is. Ez fontos lépést jelent az ügynök alapú Chatt felé, amely önállóan képes elvégezni a feladatokat.

Vizuális megértés és multimodális készségek

Az új modellek különösen figyelemre méltó tulajdonsága az, hogy képesek képekkel „gondolkodni”. Az Openaai szerint ez azt jelenti, hogy nem csak a vizuális adatokat érzékelheti, hanem közvetlenül a gondolkodási folyamatba is integrálhat. A modellek megérthetik és elemezhetik a feltöltött képeket, például a táblákat, a vázlatokat és a diagramokat, még akkor is, ha azok kevesebb minőségűek.

Ezek a multimodális készségek meghaladják a tiszta képfeldolgozást. A modellek korlátozhatják vagy átalakíthatják a képeket, kombinálhatják őket más eszközökkel, és beilleszthetik őket a gondolatmenetbe, hogy jól megalapozott következtetéseket vonjanak le. A vizuális adatoknak a gondolkodási folyamatba való integrálása jelentős előrelépést jelent a korábbi AI modellekhez képest.

Teljesítmény és referenciaértékek

O3 mint zászlóshajó modell

Az Openai O3 -t a vállalat legerősebb érvelési modelljeként írják le, amely új szabványokat határoz meg olyan területeken, mint a programozás, a matematika, a természettudományok és a vizuális észlelés. A külső szakértők által végzett értékelések során az O3 kb. 20 % -kal kevésbé súlyos hibákat követ el, mint az elődje O1, komplex, valós feladatokban.

Különböző referenciaértékekben az O3 lenyűgöző eredményeket mutat:

Új legjobb értékeket ér el a kódforrók és a swe-pad számára
Új szabványokat állít be az MMMU referenciaértékében a megértés multimodális megértése érdekében
Az olyan tudományos referenciaértékekben, mint a GPQA Diamond, amelyek PhD szinten mérik a kérdéseket, az O3 87,7% -os pontosságot ér el, szemben az O1 78% -ával

A modell különleges erősségeket mutat a programozásban, a tanácsadói területen és a kreatív feladatokban. A korai tesztelők hangsúlyozták az analitikus szigorú gondolkodási partnerét, és hangsúlyozták az új hipotézisek generálásának és kritikus értékelésének képességét - különösen a biológiai, matematikai és műszaki összefüggésekben.

O4-mini mint költséghatékony alternatíva

Az O4-MINI egy kisebb modell, amelyet a gyors és költséghatékony feldolgozáshoz optimalizáltak. Az alacsonyabb mérete ellenére figyelemre méltó eredményeket ér el, különösen a matematika, a programozási és a vizuális feladatok területén.

Ez a legerősebb modell az AIME 2024 és 2025 referenciaértékében. Az AIME 2025 -ben még a Python tolmácshoz való hozzáféréssel még 99,5 százalékos pontosságot ért el. A szakértői értékelések során az elődje O3-MINI-t is meghaladja a menta területeken és az adattudományban.

Hatékonyságának köszönhetően az O4-MINI szignifikánsan magasabb felhasználási korlátokat támogat, mint az O3, ami erős lehetőséget kínál a nagy mennyiségű és áteresztőképességű alkalmazások számára, amelyek előnyösek a logikai gondolkodásból.

Az alkalmazás és a rendelkezésre állás területei

Lehetséges felhasználások

Javított képességeikkel az új modellek különféle alkalmazásokat nyitnak meg:

Komplex problémás megoldások a tudományban és a technológiában, ahol a problémák részleges lépéseire való szétszerelésére képes képességük különösen értékes
Programozási feladatok és szoftverfejlesztés, ahol támogathatja a kódgenerációt és a hibaelhárítást
Matematikai és tudományos elemzések magas szinten
A diagramok, grafika és képek vizuális elemzése
Ügynök -alapú alkalmazások, amelyekben az AI függetlenül különböző eszközöket használ a feladatok megoldására

A felhasználók rendelkezésre állása

Az új modelleket fokozatosan elérhetővé teszik a különböző felhasználói csoportok számára:

A Chatgpt Plus, a Pro és a Team felhasználók hozzáférhetnek az O3, O4-Mini és O4-Mini-High-hez a modellválasztóban, 2025. április 16-ig, ahol
A CHATGPT Enterprise és az EDU felhasználó a közzététel utáni egy héten belül megkapja a hozzáférést
Az ingyenes felhasználók kipróbálhatják az O4-Mini-t, ha a „Gondolat” lehetőséget választják a zeneszerzőben, mielőtt elküldik a kérését
Az összes terv kamatkorlátai változatlanok maradnak az előző modellekhez képest

Alkalmas:

A Chatgpt von Openaai jelenlegi fejleményei (2025. március)

Biztonsági szempontok és továbbfejlesztés

Biztonság és robusztusság: Egy pillantás az Openai új modelljei mögött

Az Openai hangsúlyozza, hogy mindkét modellt kiterjedt biztonsági teszteknek vetették alá - a vállalat szerint ez a legátfogóbb biztonsági program eddig. A modellek progresszív érvelési képességei új módszereket kínálnak a biztonság és a robusztusság javítására. Különösen a modellek gondolkodhatnak az Openai biztonsági irányelveire, ha reagálnak a potenciálisan nem biztonságos kérdésekre - ezt a „tanácskozási igazítás” elnevezésű koncepciót.

A kiadvány az OpenAAI „Felkészültség -keretének” 2. verziója alatt zajlik. A vállalat biztonsági tanácsadó csoportja (SAG) ellenőrizte a felkészültség értékelésének eredményeit, és arra a következtetésre jutott, hogy az O3 és az O4-MINI a három megfigyelt kategóriában (biológiai és kémiai készségek, kiberbiztos és az önmagában történő továbbfejlesztés) a küszöbértéket „magas”.

Jelentése az AI táj számára

Az O3 és az O4-MINI bevezetése jelentős lépés az AI rendszerek fejlődésében. A különböző eszközök logikus gondolkodásának és integrálásának jobb képességével ezek a modellek olyan ügynök-alapú rendszerhez közelítenek, amely önállóan képes megoldani a komplex feladatokat.

Ezekkel a modellekkel az Openaai továbbra is az AI Development vezetőjén helyezkedik el, amelyet szintén hangsúlyoznak a közelmúltbeli finanszírozási forduló, amelyet a társaság 300 milliárd dollár besorolott. A jobb javítás, az eszköz integrációja és a multimodális készségek kombinációja jelentősen kibővítheti az AI alkalmazásának területét, és új alkalmazási területeket nyithat meg.

O3 és O4-mini: Erőteljes AI modellek az összetett kihívásokhoz

Az O3 és az O4-Mini segítségével az OpenAi új AI modelleket mutatott be, amelyek javított reakció képességeiknek és a különféle eszközök integrációjának köszönhetően jelentős előrelépés az AI fejlődésben. A modelleket jellemzi, hogy képesek -e átgondolni a komplex problémákat, és különféle eszközöket használnak a megoldás megtalálásához. Míg az O3 az igényes feladatok zászlóshajójaként helyezkedik el, az O4-MINI költséghatékony alternatívát kínál, amely alacsonyabb mérete ellenére lenyűgöző teljesítményt ér el.

Az új modellek már elérhetők a különféle Chatters felhasználói csoportok számára, és továbbfejlesztett képességeiknek köszönhetően kibővíthetik az AI alkalmazások spektrumát. Ugyanakkor az Openai hangsúlyozza a biztonsági szempontok fontosságát, és a modelleket kiterjedt teszteknek vetette alá a lehetséges kockázatok minimalizálása érdekében. Az O3 és az O4-Mini fejlesztése fontos lépést jelent az ügynöki alapú AI rendszerek felé, amely egyre inkább a komplex feladatokat képes önállóan elsajátítani.

Alkalmas: