
Die KI-modelle o3 mini en o3 mini high is nou beskikbaar in beide ChatPGT en via die API! – Beeld: Xpert.Digital
Eenvoudig slimmer: o3-mini en o3-mini high nou vir ChatPGT- en API-toepassings
OpenAI o3-mini: 'n Kwantumsprong in koste-effektiewe KI-ontwikkeling vir gesofistikeerde denke
Die wêreld van kunsmatige intelligensie het nog 'n mylpaal bereik met die vrystelling van OpenAI o3-mini. Hierdie moderne model, nou beskikbaar in ChatGPT en via API, verteenwoordig die nuutste en mees koste-effektiewe vooruitgang in OpenAI se redenasiemodelfamilie. Die o3-mini, wat in Desember 2024 bekendgestel is, herdefinieer die vermoëns van kleiner modelle en demonstreer uitsonderlike prestasie in wetenskap, tegnologie, ingenieurswese en wiskunde (STEM). Dit staan nie net uit vir sy indrukwekkende prestasie nie, maar ook vir sy lae koste en verminderde latensie in vergelyking met sy voorganger, OpenAI o1-mini.
OpenAI o3-mini merk 'n paradigmaskuif deur die eerste klein redenasiemodel te wees wat langverwagte ontwikkelaarskenmerke soos funksie-oproepe, gestruktureerde uitvoer en ontwikkelaarsboodskappe inheems ondersteun. Dit beteken dat dit van nuuts af ontwerp is vir onmiddellike produksiegebruik. Soos sy voorgangers o1-mini en o1-preview, ondersteun o3-mini ook stroming, wat buigsame en dinamiese interaksie moontlik maak. Ontwikkelaars kry ook die vermoë om tussen drie vlakke van redenasiepoging te kies - laag, medium en hoog. Hierdie buigsaamheid laat die model toe om aangepas te word vir verskillende gebruiksgevalle: vir komplekse uitdagings kan die redenasieproses geïntensifiseer word, terwyl die fokus vir tydkritieke take op spoed en lae latensie is.
Belangrike nota: o3-mini is nie geskik vir take wat visuele analise behels nie. Vir sulke toepassings moet ontwikkelaars voortgaan om OpenAI o1 te gebruik. Die bekendstelling van o3-mini sal plaasvind in die Chat Completions API, Assistants API, en Batch API, met toegang aanvanklik beperk tot geselekteerde API-gebruikers op vlakke 3-5.
Verwant hieraan:
ChatGPT-gebruikers trek voordeel uit verbeterde funksies
Daar is ook goeie nuus vir eindgebruikers: ChatGPT Plus-, Team- en Pro-gebruikers kan nou o3-mini gebruik, terwyl Enterprise-kliënte in Februarie toegang sal kry. o3-mini vervang o1-mini in die modelkeuse en bied hoër tempolimiete en laer latensie. Dit maak dit die ideale keuse vir take in programmering, STEM en logiese probleemoplossing. As deel van hierdie opgradering verdriedubbel die boodskaplimiet vir Plus- en Team-gebruikers van 50 boodskappe per dag (met o1-mini) tot 150 boodskappe per dag (met o3-mini).
Verder word o3-mini nou gekombineer met 'n soekfunksie om opgedateerde antwoorde met relevante bronne te verskaf. Dit verteenwoordig 'n vroeë prototipe terwyl OpenAI werk om die soekfunksie in alle redenasiemodelle te integreer. Hierdie integrasie laat die model toe om toegang tot 'n breër reeks inligting te verkry en sodoende meer ingeligte en opgedateerde antwoorde te genereer.
Gratis vir almal om te gebruik
'n Besonder noemenswaardige nuwe kenmerk is die beskikbaarheid van o3-mini vir gebruikers van die gratis ChatGPT-plan. Hulle kan die model uittoets deur "Redenering" in die boodskapsamesteller te kies of deur 'n antwoord te hergenereer. Dit is die eerste keer dat 'n redeneringsmodel aan gratis gebruikers in ChatGPT aangebied word en demonstreer OpenAI se verbintenis om hoëgehalte-KI vir almal toeganklik te maak.
Vanaf vandag (31 Januarie 2025) kan gebruikers van die gratis plan OpenAI o3-mini dit ook probeer deur "Redenering" in die boodskapsamesteller te kies of deur 'n antwoord te hergenereer. Dit is die eerste keer dat 'n redeneringsmodel beskikbaar gestel is vir gratis gebruikers in ChatGPT.
Terwyl OpenAI o1 die omvattende model vir algemene kennis bly, posisioneer o3-mini homself as 'n gespesialiseerde alternatief vir tegniese velde wat presisie en spoed vereis. In ChatGPT gebruik o3-mini standaard medium verwerkingskrag om 'n gebalanseerde kombinasie van spoed en akkuraatheid te bereik. Betalende gebruikers het ook die opsie om o3-mini-high in die modelkeuse te kies om 'n selfs meer intelligente weergawe te gebruik wat effens meer tyd vir sy reaksies benodig. Pro-gebruikers geniet onbeperkte toegang tot beide o3-mini en o3-mini-high.
Prestasie en optimalisering vir STEM-take
Soos sy voorganger o1, is o3-mini spesifiek geoptimaliseer vir STEM-take. Met medium redenasie-inspanning behaal o3-mini dieselfde prestasie as o1 in wiskunde, programmering en wetenskap, maar lewer aansienlik vinniger antwoorde. Kundige resensies het getoon dat o3-mini nie net meer akkurate en duideliker antwoorde bied nie, maar ook sterker redenasievermoë as o1-mini demonstreer. Toetsers het o3-mini se antwoorde in 56% van gevalle bo dié van o1-mini verkies en 'n indrukwekkende 39%-vermindering in ernstige foute op uitdagende, werklike vrae waargeneem. Met medium redenasie-inspanning behaal o3-mini dieselfde prestasie as o1 op sommige van die mees veeleisende assesserings van redenasievermoë en intelligensie, insluitend AIME en GPQA. Dit beklemtoon die model se vermoë om selfs komplekse probleme te hanteer.
Gedetailleerde prestasiedata in verskeie gebiede
Mededingende wiskunde (AIME 2024): In wiskunde behaal o3-mini vergelykbare prestasie as o1-mini met lae kognitiewe inspanning. Met medium inspanning is die prestasie reeds gelykstaande aan o1, terwyl dit met hoë inspanning beide o1-mini en o1 oortref. Hierdie resultate beklemtoon o3-mini se vermoë om wiskundige probleme met toenemende kognitiewe inspanning op te los.
PhD-vlakvrae (GPQA Diamant): In die wetenskappe, veral in biologie, chemie en fisika op PhD-vlak, oortref o3-mini o1-mini met lae kognitiewe inspanning. Met hoë inspanning bereik dit selfs die vlak van o1. Dit demonstreer dat o3-mini in staat is om selfs uitdagende wetenskaplike vrae te beantwoord en te verstaan.
Wiskundige Navorsing (FrontierMath): In wiskundige navorsing oortref o3-mini sy voorganger in FrontierMath met hoë berekeningsinspanning. Wanneer Python-gereedskap gebruik word, los o3-mini meer as 32% van die probleme met die eerste poging op, insluitend meer as 28% van die uitdagende T3-probleme. Dit is duidelike bewys van die model se vermoë om komplekse wiskundige probleme op te los en innoverende oplossings te ontwikkel.
Mededingende Programmering (Codeforces): In mededingende programmering op die Codeforces-vlak behaal o3-mini voortdurend hoër Elo-tellings met toenemende berekeningsinspanning. Selfs teen medium inspanning is die werkverrigting vergelykbaar met o1, terwyl dit teen hoë inspanning beide o1 en o1-mini aansienlik oortref. Hierdie resultate demonstreer die model se indrukwekkende vermoë om kode te verstaan en te genereer.
Sagteware-ingenieurswese (SWE-bench Verified): Op die gebied van sagteware-ontwikkeling is o3-mini die kragtigste model wat OpenAI tot dusver vir SWE-bench Verified vrygestel het. Dit beklemtoon die model se prestasie in praktiese sagteware-ontwikkelingscenario's.
Algemene kennis: Data-analise toon duidelike voordele van o3-mini bo o1-mini in verskeie areas van algemene kennis. Dit dui daarop dat o3-mini 'n meer omvattende begrip van die wêreld ontwikkel het.
Spoed en doeltreffendheid
Benewens sy hoë werkverrigting, staan die o3-mini ook uit vir sy indrukwekkende spoed en doeltreffendheid. In 'n A/B-toetsreeks was die o3-mini 24% vinniger as die o1-mini. Die gemiddelde reaksietyd was 7.7 sekondes in vergelyking met 10.16 sekondes vir die o1-mini. Hierdie beduidende verbetering in reaksietye maak die o3-mini 'n aantreklike opsie vir toepassings waar spoed krities is.
Verwant hieraan:
Veiligheid en belyning
OpenAI plaas groot klem op die sekuriteit van sy modelle. Om te verseker dat o3-mini veilige reaksies genereer, is beraadslagende belyningstegnieke gebruik. Sekuriteitsassesserings toon dat o3-mini beter presteer as GPT-4o in toetse vir uitdagende sekuriteit en jailbreak-scenario's. Dit beklemtoon OpenAI se verbintenis tot die ontwikkeling van veilige en verantwoordelike KI-stelsels.
o3-mini: Gevorderde KI vir 'n slimmer toekoms
o3-mini beklemtoon OpenAI se missie om koste-effektiewe KI te ontwikkel en hoëgehalte-intelligensie verder te demokratiseer. Met sy spesialisasie in STEM-take, lae koste en merkwaardige doeltreffendheid, stel o3-mini nuwe standaarde en baan die weg vir toekomstige innovasies in kunsmatige intelligensie. Die model is 'n lewendige voorbeeld van hoe KI toenemend kragtiger en toegankliker word, met die potensiaal om ons lewens op baie maniere te verbeter. Die vrystelling van o3-mini, soos dikwels gesê word, dui op 'n belangrike stap in die rigting van 'n toekoms waar KI 'n integrale deel van ons daaglikse lewens is.
Die ontwikkeling van modelle soos o3-mini is 'n voortdurende proses. Deurlopende verbetering van die algoritmes, optimalisering van neurale netwerke en die versameling van steeds groter datastelle sal in die toekoms lei tot selfs kragtiger en doeltreffender KI-stelsels. Hierdie vooruitgang belowe nie net om tegnologiese vooruitgang verder te dryf nie, maar ook om 'n positiewe impak op baie areas van ons lewens te hê. Van medisyne en onderwys tot die omgewing – die moontlikhede is feitlik eindeloos.
Die “bekendstelling van o3-mini”, volgens ’n senior ontwikkelaar by OpenAI, “is nog ’n stap op die pad om die mensdom se mees komplekse probleme met behulp van kunsmatige intelligensie op te los.” Dit is hierdie visie wat OpenAI se werk dryf en ons lei na ’n toekoms waar KI ’n kragtige instrument is om ons wêreld te verbeter. “Ons sien die ontwikkeling van o3-mini as ’n belangrike boublok wat ons in staat stel om intelligensie toeganklik te maak vir ’n groter gehoor sonder om die vermoëns daarvan in die gedrang te bring,” voeg hy by.
Kortliks, OpenAI o3-mini is nie net 'n tegnologiese deurbraak nie, maar ook bewys van hoe gevorderde tegnologie gebruik kan word om die wêreld te verander en 'n toekoms te vorm waar kunsmatige intelligensie 'n integrale deel van ons lewens is. Die "voortdurende ontwikkeling van sulke modelle" is, soos een KI-kenner dit stel, "'n bewys van die menslike gees van innovasie en die meedoënlose strewe na kennis en vooruitgang.".
Verwant hieraan:
Ons is hier vir jou - Konsultasie - Beplanning - Implementering - Projekbestuur
☑️ Ons besigheidstaal is Engels of Duits
☑️ NUUT: Korrespondensie in jou moedertaal!
Ek en my span is bly om as jou persoonlike adviseur vir jou beskikbaar te wees.
Jy kan my kontak deur die kontakvorm hier in te vul wolfenstein@xpert.digital:of my eenvoudig te skakel by +49 7348 4088 965. My e-posadres is
Ek sien uit na ons gesamentlike projek.
