Gepubliseer op: 1 Februarie 2025 / Update van: 1 Februarie 2025 - Skrywer: Konrad Wolfenstein
Simply Smarter: O3-mini en O3-mini-hoog vir CHATPGT- en API-toepassings
Openai O3-mini: 'n kwantumsprong in koste-effektiewe AI-ontwikkeling vir veeleisende denke
Die wêreld van kunsmatige intelligensie ervaar nog 'n mylpaal met die publikasie van OpenAi O3-Mini. Hierdie moderne model, wat nou in Chatt beskikbaar is en via die API toeganklik is, verteenwoordig die nuutste en koste-effektiewe vordering in die redeneringsmodelreeks van OpenAAI. O3-mini, wat in Desember 2024 aangebied is, het die moontlikhede van kleiner modelle herdefinieer en toon buitengewone vaardighede op die gebied van wetenskap, tegnologie, ingenieurswese en wiskunde (STEM). Dit word nie net gekenmerk deur sy indrukwekkende prestasie nie, maar ook deur die lae koste en verminderde latency in vergelyking met sy voorganger, OpenAi O1-mini.
OpenAI O3-Mini is 'n paradigmaskuif deur die eerste klein redeneringsmodel wat na verwagting op lang verwagte ontwikkelaarsfunksies soos funksie-oproep, gestruktureerde uitgawes en ontwikkelaarsnuus sal ondersteun. Dit beteken dat dit van nuuts af ontwerp is vir onmiddellike produksie. Soos sy voorgangers O1-mini en O1-voorskou, ondersteun O3-mini-streaming ook, wat buigsame en dinamiese interaksie moontlik maak. Ontwikkelaars het ook die opsie om tussen drie intensiteitsvlakke vir die aankoopmuur te kies - laag, medium en hoog. Met hierdie buigsaamheid kan die model by verskillende toepassings aangepas word: in die geval van ingewikkelde uitdagings, kan die denkproses versterk word, terwyl die kritieke take die fokus op spoed en lae latensie is.
'N Belangrike opmerking: O3-mini is nie geskik vir take met visuele analise nie. Vir sulke toepassings moet ontwikkelaars voortgaan om terug te val op Openai O1. O3-mini word bekendgestel in die Chat-Conpletion API, Assistants-API en Batch-API, waardeur toegang aanvanklik beperk is tot geselekteerde API-gebruikers van vlakke 3-5.
Geskik vir:
CHATGPT -gebruikers trek voordeel uit uitgebreide funksies
Daar is ook verblydende nuus vir eindgebruikers: Chatgpt Plus-gebruikers, Team en Pro kan nou O3-mini gebruik, terwyl ondernemingskliënte in Februarie toegang ontvang. O3-mini vervang O1-mini in die modelkeuse en bied hoër paaiementgrense en laer latensietye. Dit maak dit 'n ideale keuse vir take op die gebied van programmering, STEM en logiese probleemoplossing. In die loop van hierdie opgradering is die nuusgrens vir plus- en spangebruikers van 50 boodskappe per dag (met O1-mini) tot 150 boodskappe per dag (met O3-mini).
Daarbenewens word O3-mini nou gekombineer met 'n soekfunksie om huidige antwoorde met relevante bronne te verskaf. Dit verteenwoordig 'n vroeë prototipe, terwyl Openai werk om die soekfunksie in al die redeneringsmodelle te integreer. Hierdie integrasie stel die model in staat om toegang tot 'n breër spektrum van inligting te kry en sodoende meer klank en op -tot -datum -antwoorde te genereer.
Gratis gebruik vir almal
'N Besondere merkwaardige innovasie is die beskikbaarheid van O3-mini vir gebruikers van die gratis chatgpt-plan. U kan die model probeer deur 'rede' in die nuuskomponis te kies of 'n antwoord te herwin. Dit is die eerste keer dat 'n redeneringsmodel aangebied word vir gratis gebruikers in ChatGPT en die toewyding van OpenAAI demonstreer om AI van hoë gehalte vir almal toeganklik te maak.
Vanaf vandag ( 31 Januarie 2025 ) kan gebruikers van die Free Plan Openai O3-Mini ook probeer deur 'rede' in die nuuskomponis te kies of 'n antwoord weer te genereer. Dit is die eerste keer dat 'n redeneringsmodel beskikbaar gestel word vir gratis gebruikers in ChatGPT.
Terwyl Openaiai O1 die omvattende model vir algemene kennis bly, posisioneer O3-mini homself as 'n gespesialiseerde alternatief vir tegniese gebiede wat akkuraatheid en spoed verg. Standaard gebruik O3-Mini 'n mediumgrootte koopmuur om 'n gebalanseerde kombinasie van spoed en akkuraatheid te verkry. Betaalde gebruikers het ook die opsie om O3-mini-hoog in die modelkeuse te kies om 'n meer intelligente weergawe te gebruik wat 'n bietjie meer tyd neem vir hul antwoorde. Pro-gebruikers geniet onbeperkte toegang tot beide O3-mini en O3-mini-hoog.
Prestasie en optimalisering vir STEM -take
Soos sy voorganger O1, was O3-Mini spesiaal geoptimaliseer vir STEM-take. Met 'n mediumgrootte aankoopmuur behaal O3-Mini dieselfde prestasie as O1 in wiskunde, programmering en wetenskap, maar bied aansienlik vinniger antwoorde. Deskundige oorsigte het getoon dat O3-mini nie net meer noukeuriger en duideliker antwoorde bied nie, maar ook 'n sterker denkvermoë het as O1-mini. In 56% van die gevalle het toetsers die antwoorde van O3-mini verkies bo dié van O1-mini en, in die geval van veeleisende, realistiese vrae, het 'n afname in ernstige foute met indrukwekkende 39% bepaal. Met 'n mediumgrootte koopmuur behaal O3-mini dieselfde prestasie in sommige van die veeleisendste evaluerings van denke en intelligensie, insluitend Aime en GPQA. Dit onderstreep die vermoë van die model om ook ingewikkelde probleme te hanteer.
Gedetailleerde prestasiedata in verskillende gebiede
Mededinging Wiskunde (AIME 2024): In wiskunde bereik O3-mini met 'n laagtepunt die koopmuur 'n vergelykbare diens soos O1-mini. Met medium moeite stem die prestasie reeds ooreen met dié van O1, terwyl dit beide O1-mini en O1 met groot moeite oorskry. Hierdie resultate onderstreep die vermoë van O3-mini om wiskundige probleme beter op te los met die toenemende intensiteit van die koopmuur.
PhD-vrae (GPQA Diamond): Op die gebied van wetenskap, veral vir biologiese, chemiese en fisiese vrae op 'n PhD-vlak, is O3-mini met 'n lae koopmuur die werkverrigting van O1-mini. Dit bereik selfs die vlak van O1 met groot moeite. Dit wys dat O3-mini in staat is om veeleisende wetenskaplike vrae te beantwoord en te verstaan.
Navorsing in wiskunde (Frontiermath): In wiskundige navorsing oorskry O3-mini sy voorganger op Frontiermath met 'n hoë koopmuur. In die geval van take met Python-gereedskap, los O3-mini meer as 32 % van die probleme met die eerste poging, insluitend meer as 28 % van die veeleisende T3-probleme. Dit is 'n duidelike bewys van die vermoë van die model om ingewikkelde wiskundige probleme op te los en innoverende oplossings te ontwikkel.
Mededingingsprogrammering (codeforces): In die kompetisieprogrammering op Codeforces-vlak bereik O3-mini voortdurend hoër ELO-waardes met die verhoging van die koopmuur. Selfs met medium inspanning stem die werkverrigting van O1 ooreen, terwyl dit met groot inspanning beide O1 en O1-mini oorskry. Hierdie resultate illustreer die indrukwekkende vermoë van die model om kode te verstaan en te genereer.
Sagteware-ingenieurswese (SWE-Bench geverifieer): Op die gebied van sagteware-ontwikkeling is O3-Mini die kragtigste model tot dusver dat OpenAI gepubliseer het vir die geverifieerde SWE-Bench. Dit onderstreep die prestasie van die model in praktiese sagteware -ontwikkelingscenario's.
Algemene kennis: Evaluerings van die gegewens toon duidelike voordele van O3-mini in vergelyking met O1-mini op verskillende gebiede van algemene kennis. Dit dui daarop dat O3-mini 'n meer omvattende begrip van die wêreld ontwikkel het.
Spoed en doeltreffendheid
Benewens die hoë werkverrigting, word O3-mini ook gekenmerk deur die indrukwekkende spoed en doeltreffendheid daarvan. In 'n A/B-toetsreeks was O3-mini 24% vinniger as O1-mini. Die gemiddelde responstyd was 7,7 sekondes vergeleke met 10,16 sekondes by O1-mini. Hierdie beduidende verbetering in reaksietye maak O3-mini 'n aantreklike opsie vir toepassings waarin spoed van kardinale belang is.
Veiligheid en oriëntasie
OpenAI heg baie belangrik aan die veiligheid van sy modelle. Om te verseker dat O3-mini veilige antwoorde genereer, is beraadslagende belyningstegnieke gebruik. Veiligheidsevaluerings toon dat O3-mini beter daaraan toe is in toetse vir uitdagende sekuriteits- en jailbreak-scenario's as GPT-4O. Dit onderstreep die toewyding van OpenAI vir die ontwikkeling van veilige en verantwoordelike AI -stelsels.
O3-Mini: Progressiewe AI vir 'n slimmer toekoms
O3-Mini onderstreep die missie van Openaai om 'n goedkoop AI te ontwikkel en om die intelligensie van hoë gehalte verder te demokratiseer. Met sy spesialisasie in STEM-take, die lae koste en die merkwaardige doeltreffendheid, stel O3-mini nuwe standaarde en baan die weg vir toekomstige innovasies op die gebied van kunsmatige intelligensie. Die model is 'n lewendige voorbeeld van hoe AI meer en meer doeltreffend en toeganklik word en die potensiaal het om ons lewens op baie maniere te verbeter. Die "publikasie van O3-mini" -merke, soos dit dikwels gesê word, ''n belangrike stap in die rigting van 'n toekoms waarin AI 'n integrale deel van ons alledaagse lewe is'.
Die ontwikkeling van modelle soos O3-mini is 'n deurlopende proses. Die voortdurende verbetering van algoritmes, die optimalisering van die neuronale netwerke en die versameling van steeds groter datastelle sal in die toekoms tot nog meer kragtige en doeltreffende AI -stelsels lei. Dit vorder nie net om tegnologiese vooruitgang verder te bevorder nie, maar ook om 'n positiewe impak op baie terreine van ons lewens te hê. Van medisyne tot onderwys tot die omgewing - die moontlikhede is byna eindeloos.
Die 'bekendstelling van O3-mini', volgens 'n senior ontwikkelaar van Openaiai, is 'nog 'n stap op pad om die mees ingewikkelde probleme van die mensdom op te los met die hulp van kunsmatige intelligensie'. Dit is hierdie visie wat Openai se werk dryf en ons lei na 'n toekoms waarin AI 'n kragtige instrument is om ons wêreld te verbeter. "Ons beskou die ontwikkeling van O3-Mini as 'n belangrike bousteen wat ons in staat stel om intelligensie toeganklik te maak vir 'n groter gehoor sonder om die uitvoering te verwaarloos," voeg hy by.
Samevattend kan gesê word dat Openaiai O3-mini nie net 'n tegniese deurbraak is nie, maar ook 'n bewys van hoe gevorderde tegnologie gebruik kan word om die wêreld te verander en om 'n toekoms te vorm waarin kunsmatige intelligensie 'n belangrike deel van ons lewe is . Die 'voortgesette ontwikkeling van sulke modelle', soos 'n AI -kenner dit stel, is ''n bewys van die menslike innovasiegees en die aanhoudende strewe na kennis en vooruitgang'.
Geskik vir:
Ons is daar vir jou - advies - beplanning - implementering - projekbestuur
☑️ Ons besigheidstaal is Engels of Duits
☑️ NUUT: Korrespondensie in jou landstaal!
Ek sal graag jou en my span as 'n persoonlike adviseur dien.
Jy kan my kontak deur die kontakvorm hier in te vul of bel my eenvoudig by +49 89 89 674 804 (München) . My e-posadres is: wolfenstein ∂ xpert.digital
Ek sien uit na ons gesamentlike projek.