Diterbitkan pada: 1 Februari 2025 / Pembaruan dari: 1 Februari 2025 - Penulis: Konrad Wolfenstein
Sederhananya: O3-Mini dan O3-Mini-High sekarang untuk aplikasi ChatPGT dan API
Openai O3-Mini: Lompatan kuantum dalam pengembangan AI yang hemat biaya untuk pemikiran yang menuntut
Dunia Kecerdasan Buatan mengalami tonggak sejarah lain dengan publikasi Openaai O3-Mini. Model canggih ini, yang sekarang tersedia di Chatt dan dapat diakses melalui API, mewakili kemajuan terbaru dan paling hemat biaya dalam seri model penalaran dari OpenAai. Disajikan pada bulan Desember 2024, O3-Mini mendefinisikan kembali kemungkinan model yang lebih kecil dan menunjukkan keterampilan luar biasa di bidang sains, teknologi, teknik dan matematika (STEM). Ini tidak hanya ditandai dengan kinerjanya yang mengesankan, tetapi juga dengan biaya rendah dan berkurangnya latensi dibandingkan dengan pendahulunya, Openaai O1-Mini.
Openai O3-Mini menandai perubahan paradigma oleh model penalaran kecil pertama yang diharapkan untuk mendukung fungsi pengembang yang telah lama ditunggu-tunggu seperti panggilan fungsi, edisi terstruktur dan berita pengembang. Ini berarti bahwa itu dirancang dari awal untuk penggunaan produksi segera. Seperti pratinjau pendahulunya O1-Mini dan O1, streaming O3-mini juga mendukung, yang memungkinkan interaksi yang fleksibel dan dinamis. Pengembang juga memiliki pilihan untuk memilih antara tiga tingkat intensitas untuk dinding pembelian - rendah, sedang dan tinggi. Fleksibilitas ini memungkinkan model untuk disesuaikan dengan aplikasi yang berbeda: jika terjadi tantangan yang kompleks, proses berpikir dapat diintensifkan, sementara dalam tugas -waktu -yang fokusnya adalah pada kecepatan dan latensi rendah.
Catatan penting: O3-Mini tidak cocok untuk tugas dengan analisis visual. Untuk aplikasi seperti itu, pengembang harus terus jatuh kembali di OpenAI O1. O3-Mini diperkenalkan dalam API pelengkapan obrolan, asisten-API dan batch-API, di mana akses awalnya terbatas pada pengguna API yang dipilih dari Level 3-5.
Cocok untuk:
Pengguna chatgpt mendapat manfaat dari fungsi yang diperluas
Ada juga berita yang memuaskan bagi pengguna akhir: ChatGPT Plus Pengguna, Tim dan Pro sekarang dapat menggunakan O3-Mini, sementara pelanggan perusahaan menerima akses pada bulan Februari. O3-Mini menggantikan O1-Mini dalam pemilihan model dan menawarkan batas angsuran yang lebih tinggi dan waktu latensi yang lebih rendah. Ini membuatnya menjadi pilihan yang ideal untuk tugas -tugas di bidang pemrograman, batang, dan pemecahan masalah logis. Dalam perjalanan peningkatan ini, batas berita untuk Plus dan pengguna tim dari 50 pesan per hari (dengan O1-Mini) hingga 150 pesan per hari (dengan O3-Mini).
Selain itu, O3-Mini sekarang dikombinasikan dengan fungsi pencarian untuk memberikan jawaban saat ini dengan sumber yang relevan. Ini mewakili prototipe awal, sementara OpenAI berfungsi untuk mengintegrasikan fungsi pencarian ke dalam semua model penalaran. Integrasi ini memungkinkan model untuk mengakses spektrum informasi yang lebih luas dan dengan demikian menghasilkan lebih banyak jawaban suara dan up -to -date.
Penggunaan gratis untuk semua orang
Inovasi yang sangat luar biasa adalah ketersediaan O3-Mini untuk pengguna Paket ChatGPT gratis. Anda dapat mencoba model dengan memilih "alasan" di komposer berita atau mendapatkan kembali jawaban. Ini adalah pertama kalinya model penalaran ditawarkan untuk pengguna gratis di chatgpt dan menunjukkan komitmen OpenAai untuk membuat AI berkualitas tinggi dapat diakses oleh semua orang.
Pada hari ini ( 31 Januari 2025 ), pengguna rencana gratis OpenAI O3-Mini juga dapat mencoba dengan memilih "alasan" di komposer berita atau menghasilkan kembali jawaban. Ini adalah pertama kalinya model penalaran tersedia untuk pengguna gratis di chatgpt.
Sementara Openaai O1 tetap menjadi model komprehensif untuk pengetahuan umum, O3-Mini memposisikan dirinya sebagai alternatif khusus untuk bidang teknis yang membutuhkan presisi dan kecepatan. Secara default, O3-Mini menggunakan dinding pembelian berukuran sedang untuk mencapai kombinasi kecepatan dan akurasi yang seimbang. Pengguna yang membayar juga memiliki opsi untuk memilih O3-mini-tinggi dalam pemilihan model untuk menggunakan versi yang lebih cerdas yang membutuhkan sedikit lebih banyak waktu untuk jawaban mereka. Pengguna Pro menikmati akses tidak terbatas ke O3-Mini dan O3-Mini-High.
Kinerja dan optimasi untuk tugas STEM
Seperti pendahulunya O1, O3-Mini secara khusus dioptimalkan untuk tugas STEM. Dengan dinding pembelian berukuran sedang, O3-Mini mencapai kinerja yang sama dengan O1 dalam matematika, pemrograman dan sains, tetapi memberikan jawaban yang jauh lebih cepat. Ulasan ahli telah menunjukkan bahwa O3-Mini tidak hanya memberikan jawaban yang lebih tepat dan lebih jelas, tetapi juga memiliki kapasitas berpikir yang lebih kuat daripada O1-Mini. Dalam 56% kasus, penguji lebih suka jawaban dari O3-mini daripada O1-Mini dan, jika terjadi pertanyaan yang menuntut, realistis, menentukan penurunan kesalahan serius dengan 39% yang mengesankan. Dengan dinding pembelian berukuran sedang, O3-Mini mencapai kinerja yang sama dalam beberapa evaluasi pemikiran dan kecerdasan yang paling menuntut, termasuk AIME dan GPQA. Ini menggarisbawahi kemampuan model untuk juga menangani masalah yang kompleks.
Data kinerja terperinci di berbagai bidang
Kompetisi Matematika (AIME 2024): Dalam matematika, O3-mini dengan dinding pembelian yang rendah mencapai layanan yang sebanding seperti O1-Mini. Dengan upaya sedang, kinerja sudah sesuai dengan O1, sementara itu melebihi O1-Mini dan O1 dengan upaya besar. Hasil ini menggarisbawahi kemampuan O3-mini untuk memecahkan masalah matematika dengan lebih baik dengan meningkatnya intensitas dinding pembelian.
Pertanyaan PhD (GPQA Diamond): Di bidang ilmu pengetahuan, terutama untuk pertanyaan biologis, kimia dan fisik pada tingkat PhD, O3-mini dengan dinding pembelian rendah melebihi kinerja O1-Mini. Bahkan mencapai tingkat O1 dengan usaha besar. Ini menunjukkan bahwa O3-Mini dapat menjawab dan memahami pertanyaan ilmiah yang menuntut.
Penelitian dalam Matematika (Frontiermath): Dalam Penelitian Matematika, O3-Mini melebihi pendahulunya di Frontiermath dengan dinding pembelian yang tinggi. Dalam kasus tugas dengan alat Python, O3-Mini memecahkan lebih dari 32 % masalah dengan upaya pertama, termasuk lebih dari 28 % dari masalah T3 yang menuntut. Ini adalah bukti yang jelas dari kemampuan model untuk memecahkan masalah matematika yang kompleks dan mengembangkan solusi inovatif.
Pemrograman Persaingan (Codeforces): Dalam pemrograman kompetisi di tingkat Codeforces, O3-Mini terus mencapai nilai ELO yang lebih tinggi dengan meningkatkan dinding pembelian. Bahkan dengan upaya sedang, kinerja O1 sesuai, sementara dengan upaya tinggi melebihi O1 dan O1-Mini. Hasil ini menggambarkan kemampuan model yang mengesankan untuk memahami dan menghasilkan kode.
Rekayasa Perangkat Lunak (SWE-Bench Diverifikasi): Di bidang pengembangan perangkat lunak, O3-Mini adalah model paling kuat sejauh ini yang telah diterbitkan OpenAI untuk SWE-Bench diverifikasi. Ini menggarisbawahi kinerja model dalam skenario pengembangan perangkat lunak praktis.
Pengetahuan Umum: Evaluasi data menunjukkan keunggulan yang jelas dari O3-mini dibandingkan dengan O1-Mini di berbagai bidang pengetahuan umum. Ini menunjukkan bahwa O3-Mini telah mengembangkan pemahaman dunia yang lebih komprehensif.
Kecepatan dan efisiensi
Selain kinerja tinggi, O3-Mini juga ditandai dengan kecepatan dan efisiensinya yang mengesankan. Dalam seri uji A/B, O3-Mini 24% lebih cepat dari O1-Mini. Waktu respons rata-rata adalah 7,7 detik dibandingkan dengan 10,16 detik pada O1-Mini. Peningkatan yang signifikan dalam waktu respons ini menjadikan O3-Mini pilihan yang menarik untuk aplikasi di mana kecepatan sangat penting.
Keamanan dan orientasi
Openai sangat mementingkan keamanan modelnya. Untuk memastikan bahwa O3-Mini menghasilkan jawaban yang aman, teknik perataan yang disengaja digunakan. Evaluasi keselamatan menunjukkan bahwa O3-Mini lebih baik dalam tes untuk menantang skenario keamanan dan jailbreak daripada GPT-4O. Ini menggarisbawahi komitmen openai untuk pengembangan sistem AI yang aman dan bertanggung jawab.
O3-Mini: AI progresif untuk masa depan yang lebih pintar
O3-Mini menggarisbawahi misi Openaai untuk mengembangkan AI yang murah dan semakin mendemokratisasi kecerdasan berkualitas tinggi. Dengan spesialisasi dalam tugas STEM, biaya rendah dan efisiensi yang luar biasa, O3-Mini menetapkan standar baru dan membuka jalan bagi inovasi di masa depan di bidang kecerdasan buatan. Model ini adalah contoh yang hidup tentang bagaimana AI menjadi lebih dan lebih efisien dan dapat diakses dan memiliki potensi untuk meningkatkan kehidupan kita dalam banyak hal. Tanda "publikasi O3-Mini", seperti yang sering dikatakan, "langkah yang signifikan menuju masa depan di mana AI adalah bagian integral dari kehidupan kita sehari-hari".
Pengembangan model seperti O3-Mini adalah proses yang berkelanjutan. Peningkatan algoritma yang berkelanjutan, optimalisasi jaringan neuron dan pengumpulan set data yang lebih besar akan mengarah pada sistem AI yang lebih kuat dan efisien di masa depan. Kemajuan ini tidak hanya berjanji untuk lebih memajukan kemajuan teknologi, tetapi juga memiliki dampak positif pada banyak bidang kehidupan kita. Dari kedokteran hingga pendidikan ke lingkungan - kemungkinan hampir tidak ada habisnya.
"Pengenalan O3-Mini", menurut pengembang senior Openaai, adalah "langkah lain dalam perjalanan untuk memecahkan masalah kemanusiaan yang paling kompleks dengan bantuan kecerdasan buatan". Visi inilah yang mendorong pekerjaan Openai dan membawa kita ke masa depan di mana AI adalah alat yang ampuh untuk meningkatkan dunia kita. "Kami melihat pengembangan O3-Mini sebagai blok bangunan penting yang memungkinkan kami membuat kecerdasan dapat diakses oleh khalayak yang lebih luas tanpa mengabaikan kinerja," tambahnya.
Singkatnya, dapat dikatakan bahwa Openaai O3-Mini tidak hanya terobosan teknis, tetapi juga bukti bagaimana teknologi canggih dapat digunakan untuk mengubah dunia dan membentuk masa depan di mana kecerdasan buatan adalah bagian penting dari kehidupan kita . "Pengembangan model semacam itu yang berkelanjutan", seperti yang dikatakan oleh seorang ahli AI, adalah "bukti semangat inovasi manusia dan upaya yang tak henti -hentinya untuk pengetahuan dan kemajuan".
Cocok untuk:
Kami siap membantu Anda - saran - perencanaan - implementasi - manajemen proyek
☑️ Bahasa bisnis kami adalah Inggris atau Jerman
☑️ BARU: Korespondensi dalam bahasa nasional Anda!
Saya akan dengan senang hati melayani Anda dan tim saya sebagai penasihat pribadi.
Anda dapat menghubungi saya dengan mengisi formulir kontak atau cukup hubungi saya di +49 89 89 674 804 (Munich) . Alamat email saya adalah: wolfenstein ∂ xpert.digital
Saya menantikan proyek bersama kita.