Chatgpt wordt een super-KI-agent: Openai's nieuwe AI-modellen O3 en O4-Mini denken nu na!

Gepubliceerd op: 17 april 2025 / UPDATE VAN: 17 april 2025 - Auteur: Konrad Wolfenstein

Chatgpt wordt een super-KI-agent: Openai's nieuwe AI-modellen O3 en O4-Mini denken nu na! - Afbeelding: Xpert.Digital

Intelligenter dan ooit: OpenAai's O -serie onder de indruk van nieuwe vaardigheden

Wiskunde, programmeren en meer: Openai's O4-Mini is het nieuwe AI Wonder Child! - Openai's O3 begrijpt foto's en lost problemen op als nooit tevoren!

Op 16 april 2025 presenteerde Openai twee nieuwe AI-modellen in zijn O-serie-O3 en O4-Mini. Deze worden de meest intelligente en krachtigste modellen van het bedrijf genoemd. De nieuwe systemen worden gekenmerkt door verbeterde denkvaardigheden en kunnen alle tools die beschikbaar zijn in Chatt voor het eerst in Chatt gebruiken en combineren. Ze waren speciaal getraind om langer na te denken vóór de antwoordopwekking, waardoor ze bijzonder effectief zijn in complexe taken zoals programmeren, wiskunde en visuele analyse.

Geschikt hiervoor:

Chatgpt krijgt geheugen en herinnert nu alles (bijna): de nieuwe geheugenfunctie in detail

De nieuwe O-serie modellen in één oogopslag

Basiseigenschappen en vaardigheden

De O-serie van OpenAI vertegenwoordigt een paradigmaverschuiving in AI-ontwikkeling. De modellen werden getraind met behulp van versterkingsleren om langere processen van denken uit te voeren vóór het genereren van antwoord. Met deze benadering kunnen de modellen verschillende oplossingsstrategieën proberen, fouten herkennen en complexe problemen demonteren in eenvoudigere substappen.

Een belangrijke innovatie op O3 en O4-Mini is de mogelijkheid om alle beschikbare Chattt-tools onafhankelijk en op agent gebaseerd te gebruiken. Dit omvat webzoekopdrachten, op Python gebaseerde gegevensanalyse, beeldverwerking, beeldgeneratie, canvas, automatisering, het zoeken naar bestanden en geheugenfuncties. Deze tools zijn rechtstreeks geïntegreerd in het denkproces van de modellen om hun vaardigheden uit te breiden en meer complexe taken te beheren.

De modellen kunnen zelf beslissen wanneer en hoe ze deze tools het beste gebruiken, en leveren meestal antwoorden in minder dan een minuut, zelfs met complexere problemen. Dit markeert een belangrijke stap in de richting van een agent -gebaseerd Chatt dat taken onafhankelijk kan uitvoeren.

Visueel begrip en multimodale vaardigheden

Een bijzonder opmerkelijke eigenschap van de nieuwe modellen is hun vermogen om met foto's te 'denken'. Volgens OpenAai betekent dit dat u niet alleen visuele gegevens kunt waarnemen, maar ook rechtstreeks in uw denkproces kunt integreren. De modellen kunnen geüploade afbeeldingen zoals whiteboards, schetsen en diagrammen begrijpen en analyseren, zelfs als ze van minder kwaliteit zijn.

Deze multimodale vaardigheden gaan verder dan pure beeldverwerking. De modellen kunnen beelden beperken of transformeren, ze combineren met andere tools en ze in hun gedachtegang opnemen om goed te trekken conclusies te trekken. Deze integratie van visuele gegevens in het denkproces is een aanzienlijke vooruitgang in vergelijking met eerdere AI -modellen.

Prestaties en benchmarks

O3 als een vlaggenschipmodel

Openai O3 wordt beschreven als het krachtigste redeneermodel van het bedrijf, dat nieuwe normen stelt op gebieden zoals programmeren, wiskunde, natuurwetenschappen en visuele perceptie. In evaluaties door externe experts maakt O3 ongeveer 20 procent minder ernstige fouten dan zijn voorganger O1 in complexe, echte taken.

In verschillende benchmarks vertoont O3 indrukwekkende resultaten:

Het bereikt nieuwe beste waarden voor codeforces en swe-bank
Het stelt nieuwe normen in de MMMU -benchmark voor multimodaal begrip van begrip
In wetenschappelijke benchmarks zoals GPQA Diamond, die vragen op het doctoraatniveau meten, bereikt O3 een nauwkeurigheid van 87,7% vergeleken met 78% bij O1

Het model toont speciale sterke punten in het programmeren, in het adviesgebied en bij creatieve taken. Vroege testers benadrukten zijn analytische strikte als een denkpartner en benadrukten zijn vermogen om nieuwe hypothesen te genereren en kritisch te evalueren - vooral in biologische, wiskundige en technische contexten.

O4-mini als een kostenefficiënt alternatief

De O4-Mini is een kleiner model dat is geoptimaliseerd voor snelle en kostenefficiënte verwerking. Ondanks de lagere omvang behaalt het opmerkelijke prestaties, vooral op het gebied van wiskunde, programmering en visuele taken.

Het is het krachtigste model in de benchmark AIME 2024 en 2025. In de AIME 2025 bereikte het zelfs een indrukwekkende nauwkeurigheid van 99,5 procent met toegang tot een python -tolk. In deskundige evaluaties overschrijdt het ook zijn voorganger O3-Mini in niet-MINT-gebieden en in data science.

Dankzij de efficiëntie ondersteunt O4-Mini aanzienlijk hogere gebruikslimieten dan O3, waardoor het een sterke optie is voor toepassingen met een hoog volume en doorvoer die profiteren van logisch denken.

Gebieden van toepassing en beschikbaarheid

Mogelijk gebruik

Met hun verbeterde vaardigheden openen de nieuwe modellen verschillende applicaties:

Complexe probleemoplossingen in wetenschap en technologie, waar hun vermogen om problemen in gedeeltelijke stappen te demonteren, bijzonder waardevol is
Programmeertaken en softwareontwikkeling, waar u de codegisatie en probleemoplossing kunt ondersteunen
Wiskundige en wetenschappelijke analyses op een hoog niveau
Visuele analyse van diagrammen, afbeeldingen en afbeeldingen
Agent -gebaseerde toepassingen waarin de AI onafhankelijk verschillende tools gebruikt om taken op te lossen

Beschikbaarheid voor gebruikers

De nieuwe modellen worden geleidelijk beschikbaar gesteld voor verschillende gebruikersgroepen:

Chatgpt Plus, Pro- en Team-gebruikers hebben toegang tot O3, O4-Mini en O4-Mini-High in de modelselector sinds 16 april 2025, waar
Chatgpt Enterprise en EDU -gebruiker ontvangen binnen een week na publicatie toegang
Gratis gebruikers kunnen O4-Mini uitproberen door "Think" in de componist te selecteren voordat u uw verzoek verzendt
De rentelimieten voor alle plannen blijven ongewijzigd in vergelijking met de vorige modellen

Geschikt hiervoor:

Huidige ontwikkelingen in Chatgpt von OpenAai (maart 2025)

Beveiligingsaspecten en verdere ontwikkeling

Beveiliging en robuustheid: een blik achter de nieuwe modellen van Openai

Openai benadrukt dat beide modellen zijn onderworpen aan uitgebreide beveiligingstests - volgens het bedrijf is het tot nu toe het meest uitgebreide beveiligingsprogramma. De progressieve redeneervaardigheden van de modellen bieden nieuwe manieren om de beveiliging en robuustheid te verbeteren. In het bijzonder kunnen de modellen nadenken over de beveiligingsrichtlijnen van OpenAI als ze reageren op mogelijk onveilige onderzoeken - een concept genaamd "deliberatieve afstemming".

De publicatie vindt plaats onder versie 2 van het "Preparedness Framework" van OpenAai. De veiligheidsadviesgroep van het bedrijf (SAG) controleerde de resultaten van de paraatheidsevaluaties en kwam tot de conclusie dat O3 en O4-Mini in NO van de drie gecontroleerde categorieën (biologische en chemische vaardigheden, cyberproof en AI zelfverbetering) de drempel "hoog" bereiken.

Betekenis voor het AI -landschap

De introductie van O3 en O4-Mini is een belangrijke stap in de evolutie van AI-systemen. Met hun verbeterde vermogen om verschillende tools logisch te denken en te integreren, benaderen deze modellen een agent-gebaseerd systeem dat onafhankelijk complexe taken kan oplossen.

Met deze modellen blijft OpenAai zich positioneren aan het hoofd van de AI -ontwikkeling, die ook wordt onderstreept door de recente financieringsronde, die het bedrijf $ 300 miljard beoordeelde. De combinatie van verbeterde corrigeren, toolintegratie en multimodale vaardigheden kan het toepassingsgebied van AI aanzienlijk uitbreiden en nieuwe toepassingsgebieden openen.

O3 en O4-Mini: krachtige AI-modellen voor complexe uitdagingen

Met O3 en O4-Mini heeft OpenAI nieuwe AI-modellen gepresenteerd, die, dankzij hun verbeterde reactiemogelijkheden en de integratie van verschillende tools, aanzienlijke vooruitgang zijn in de ontwikkeling van AI. De modellen worden gekenmerkt door hun vermogen om door complexe problemen te denken en verschillende tools te gebruiken om oplossing te vinden. Hoewel O3 wordt gepositioneerd als een vlaggenschipmodel voor veeleisende taken, biedt O4-Mini een kostenefficiënt alternatief dat, ondanks de lagere omvang, indrukwekkende prestaties behaalt.

De nieuwe modellen zijn al beschikbaar voor verschillende gebruikersgroepen van Chatters en kunnen het spectrum van AI -applicaties uitbreiden dankzij hun verbeterde vaardigheden. Tegelijkertijd benadrukt Openai het belang van beveiligingsaspecten en heeft de modellen onderworpen aan uitgebreide tests om potentiële risico's te minimaliseren. De ontwikkeling van O3 en O4-Mini markeert een belangrijke stap in de richting van agentgebaseerde AI-systemen, die complexe taken in toenemende mate onafhankelijk kunnen beheersen.

Geschikt hiervoor: