Chatgpt word 'n super-ki-agent: Openai se nuwe AI-modelle O3 en O4-mini dink nou!

Gepubliseer op: 17 April 2025 / Update van: 17 April 2025 - Skrywer: Konrad Wolfenstein

Chatgpt word 'n super-ki-agent: Openai se nuwe AI-modelle O3 en O4-mini dink nou! - Beeld: Xpert.digital

Meer intelligent as ooit: Openaiai se O -reeks was beïndruk met nuwe vaardighede

Wiskunde, programmering en meer: Openai's O4-Mini is die nuwe AI Wonder Child! - Openai's O3 verstaan foto's en los probleme op soos nog nooit tevore nie!

Op 16 April 2025 het OpenAI twee nuwe AI-modelle in sy O-reeks-O3 en O4-mini aangebied. Dit word die intelligentste en kragtigste modelle van die onderneming genoem. Die nuwe stelsels word gekenmerk deur verbeterde denkvaardighede en kan vir die eerste keer alle instrumente wat in Chatt beskikbaar is, gebruik en kombineer. Hulle was spesiaal opgelei om langer na te dink voor die antwoordgenerering, wat hulle veral effektief maak in komplekse take soos programmering, wiskunde en visuele analise.

Geskik vir:

Chatgpt kry geheue en onthou nou alles (amper): die nuwe geheuefunksie in detail

Die nuwe O-reeks modelle in 'n oogopslag

Basiese eienskappe en vaardighede

Die O-reeks van OpenAI verteenwoordig 'n paradigmaverskuiwing in AI-ontwikkeling. Die modelle is opgelei met behulp van versterkingsleer om voor die antwoordgenerasie langer denkprosesse uit te voer. Hierdie benadering stel die modelle in staat om verskillende oplossingsstrategieë te probeer, foute te herken en ingewikkelde probleme in eenvoudiger substappe uitmekaar te haal.

'N Beduidende innovasie op O3 en O4-mini is die vermoë om alle beskikbare Chattt-instrumente onafhanklik en agent gebaseer te gebruik. Dit sluit websoek, Python-gebaseerde data-analise, beeldverwerking, beeldgenerering, doek, outomatisering, lêersoek en geheuefunksies in. Hierdie instrumente word direk in die denkproses van die modelle geïntegreer om hul vaardighede uit te brei en om meer ingewikkelde take te bestuur.

Die modelle kan self besluit wanneer en hoe hulle hierdie instrumente die beste gebruik en gewoonlik in minder as een minuut antwoorde lewer, selfs met meer ingewikkelde probleme. Dit is 'n belangrike stap in die rigting van 'n agent -gebaseerde chatt wat take onafhanklik kan uitvoer.

Visuele begrip en multimodale vaardighede

'N Besondere merkwaardige eienskap van die nuwe modelle is hul vermoë om met foto's te “dink”. Volgens OpenAI beteken dit dat u nie net visuele data kan waarneem nie, maar ook direk in u denkproses kan integreer. Die modelle kan opgelaaide beelde soos witborde, sketse en diagramme verstaan en ontleed, selfs al is dit van minder gehalte.

Hierdie multimodale vaardighede strek verder as suiwer beeldverwerking. Die modelle kan beelde beperk of transformeer, dit met ander gereedskap kombineer en dit in hul denkwyse insluit om goed -gefonde gevolgtrekkings te maak. Hierdie integrasie van visuele data in die denkproses verteenwoordig beduidende vordering in vergelyking met vorige AI -modelle.

Prestasie en maatstawwe

O3 as 'n vlagskipmodel

Openai O3 word beskryf as die maatskappy se kragtigste redeneringsmodel, wat nuwe standaarde stel in gebiede soos programmering, wiskunde, natuurwetenskappe en visuele persepsie. In evaluerings deur eksterne kundiges maak O3 ongeveer 20 persent minder ernstige foute as sy voorganger O1 in komplekse, werklike take.

In verskillende maatstawwe toon O3 indrukwekkende resultate:

Dit bereik nuwe beste waardes vir codeforces en SWE-Bench
Dit stel nuwe standaarde in die MMMU -maatstaf vir multimodale begrip van begrip
In wetenskaplike maatstawwe soos GPQA Diamond, wat vrae op PhD -vlak meet, behaal O3 'n akkuraatheid van 87,7% in vergelyking met 78% op O1

Die model toon spesiale sterk punte in programmering, in die konsultasiegebied en in kreatiewe take. Vroeë toetsers beklemtoon sy analitiese streng as 'n denkvennoot en beklemtoon sy vermoë om nuwe hipoteses te genereer en krities te evalueer - veral in biologiese, wiskundige en tegniese kontekste.

O4-mini as 'n koste-effektiewe alternatief

Die O4-mini is 'n kleiner model wat geoptimaliseer is vir vinnige en kostedoeltreffende verwerking. Ondanks die laer grootte, behaal dit merkwaardige prestasies, veral op die gebiede van wiskunde, programmering en visuele take.

Dit is die kragtigste model in die Aime 2024 en 2025 -maatstaf. In die AIME 2025 het dit selfs 'n indrukwekkende akkuraatheid van 99,5 persent bereik met toegang tot 'n Python -tolk. In kundige evaluerings oorskry dit ook sy voorganger O3-mini in nie-mined-gebiede en in datawetenskap.

Danksy die doeltreffendheid daarvan ondersteun O4-mini aansienlik hoër gebruiksgrense as O3, wat dit 'n sterk opsie maak vir toepassings met 'n hoë volume en deurset wat voordeel trek uit logiese denke.

Gebiede van toepassing en beskikbaarheid

Moontlike gebruike

Met hul verbeterde vaardighede open die nuwe modelle 'n verskeidenheid toepassings:

Komplekse probleemoplossings in wetenskap en tegnologie, waar hul vermoë om probleme in gedeeltelike stappe uitmekaar te haal, veral waardevol is
Programmeringstake en sagteware -ontwikkeling, waar u die kodegenisering en probleemoplossing kan ondersteun
Wiskundige en wetenskaplike ontledings op 'n hoë vlak
Visuele analise van diagramme, grafika en prente
Agent -gebaseerde toepassings waarin die AI onafhanklik verskillende instrumente gebruik om take op te los

Beskikbaarheid vir gebruikers

Die nuwe modelle word geleidelik beskikbaar gestel vir verskillende gebruikersgroepe:

Chatgpt Plus, Pro- en spangebruikers het toegang tot O3, O4-mini en O4-mini-hoog in die modelkeuse sedert 16 April 2025, waar
Chatgpt Enterprise en EDU -gebruiker ontvang toegang binne 'n week na publikasie
Gratis gebruikers kan O4-mini probeer deur 'dink' in die komponis te kies voordat u u versoek stuur
Die koerslimiete vir alle planne bly onveranderd in vergelyking met die vorige modelle

Geskik vir:

Huidige ontwikkelings in Chatgpt von Openaiai (Maart 2025)

Veiligheidsaspekte en verdere ontwikkeling

Veiligheid en robuustheid: 'n blik agter Openai se nuwe modelle

Openai benadruk dat albei modelle aan uitgebreide sekuriteitstoetse onderwerp is - volgens die maatskappy is dit tot dusver die mees omvattende sekuriteitsprogram. Die progressiewe redenasievaardighede van die modelle bied nuwe maniere om veiligheid en robuustheid te verbeter. Die modelle kan veral nadink oor die veiligheidsriglyne van OpenAI as hulle reageer op potensieel onveilige navrae - 'n konsep genaamd 'beraadslagende belyning'.

Die publikasie vind plaas onder weergawe 2 van die “Preparedness Framework” deur OpenAAI. Die maatskappy se veiligheidsadviesgroep (SAG) het die resultate van die paraatheidsevaluerings nagegaan en tot die gevolgtrekking gekom dat O3 en O4-mini in No van die drie gemoniteerde kategorieë (biologiese en chemiese vaardighede, kuberdig en AI selfverbetering) die drempel “hoog” bereik.

Betekenis vir die AI -landskap

Die bekendstelling van O3 en O4-mini is 'n belangrike stap in die evolusie van AI-stelsels. Met hul verbeterde vermoë om verskillende instrumente logies te dink en te integreer, benader hierdie modelle 'n agentgebaseerde stelsel wat komplekse take onafhanklik kan oplos.

Met hierdie modelle posisioneer Openaai homself aan die hoof van AI -ontwikkeling, wat ook onderstreep word deur die onlangse finansieringsronde, wat die maatskappy $ 300 miljard beoordeel het. Die kombinasie van verbeterde regstelling, werktuigintegrasie en multimodale vaardighede kan die toepassingsarea van AI aansienlik uitbrei en nuwe toepassingsvelde oopmaak.

O3 en O4-mini: Kragtige AI-modelle vir ingewikkelde uitdagings

Met O3 en O4-Mini het OpenAI nuwe AI-modelle aangebied, wat danksy hul verbeterde reaksiemoontlikhede en die integrasie van verskillende instrumente beduidende vordering is met die ontwikkeling van AI. Die modelle word gekenmerk deur hul vermoë om ingewikkelde probleme deur te dink en verskillende instrumente te gebruik om oplossing te vind. Terwyl O3 geposisioneer is as 'n vlagskipmodel vir veeleisende take, bied O4-Mini 'n koste-effektiewe alternatief wat, ondanks sy laer grootte, indrukwekkende prestasie behaal.

Die nuwe modelle is reeds beskikbaar vir verskillende gebruikersgroepe van Chatters en kan die spektrum van AI -toepassings uitbrei danksy hul verbeterde vaardighede. Terselfdertyd beklemtoon OpenAI die belangrikheid van veiligheidsaspekte en het die modelle aan uitgebreide toetse onderwerp om potensiële risiko's te verminder. Die ontwikkeling van O3 en O4-mini is 'n belangrike stap in die rigting van agentgebaseerde AI-stelsels, wat toenemend ingewikkelde take onafhanklik kan bemeester.

Geskik vir: