Diterbitkan pada: 17 April 2025 / Pembaruan Dari: 17 April 2025 - Penulis: Konrad Wolfenstein
Chatgpt menjadi agen super-ki: Model AI baru Openai O3 dan O4-Mini Berpikir Sekarang! - Gambar: xpert.digital
Lebih Cerdas Dari Sebelumnya: Seri O Openaai terkesan dengan keterampilan baru
Matematika, Pemrograman & Lainnya: O4-Mini Openai adalah AI Wonder Child baru! - O3 Openai memahami gambar & memecahkan masalah tidak seperti sebelumnya!
Pada 16 April 2025, Openai mempresentasikan dua model AI baru dalam O O O-O3 dan O4-Mini-nya. Ini disebut sebagai model perusahaan yang paling cerdas dan paling kuat. Sistem baru ditandai dengan peningkatan keterampilan berpikir dan dapat menggunakan dan menggabungkan semua alat yang tersedia di Chatt untuk pertama kalinya. Mereka secara khusus dilatih untuk dipikirkan lebih lama sebelum generasi jawaban, yang membuat mereka sangat efektif dalam tugas -tugas kompleks seperti pemrograman, matematika dan analisis visual.
Cocok untuk:
- Chatgpt mendapatkan memori dan sekarang mengingat semuanya (hampir): Fungsi memori baru secara rinci
Model O-Series baru sekilas
Properti dan Keterampilan Dasar
O-series dari OpenAI mewakili perubahan paradigma dalam pengembangan AI. Model -model dilatih menggunakan pembelajaran penguatan untuk melakukan proses berpikir yang lebih lama sebelum generasi jawaban. Pendekatan ini memungkinkan model untuk mencoba strategi solusi yang berbeda, mengenali kesalahan dan membongkar masalah kompleks menjadi sub -step yang lebih sederhana.
Inovasi yang signifikan pada O3 dan O4-Mini adalah kemampuan untuk menggunakan semua alat Chattt yang tersedia secara mandiri dan berbasis agen. Ini termasuk pencarian web, analisis data berbasis python, pemrosesan gambar, pembuatan gambar, kanvas, otomatisasi, pencarian file dan fungsi memori. Alat -alat ini diintegrasikan langsung ke dalam proses berpikir model untuk memperluas keterampilan mereka dan mengelola tugas yang lebih kompleks.
Model dapat memutuskan sendiri kapan dan bagaimana mereka menggunakan alat ini dan biasanya memberikan jawaban dalam waktu kurang dari satu menit, bahkan dengan masalah yang lebih kompleks. Ini menandai langkah penting menuju chatt berbasis agen yang dapat melakukan tugas secara mandiri.
Pemahaman visual dan keterampilan multimodal
Properti yang sangat luar biasa dari model baru adalah kemampuan mereka untuk "berpikir" dengan gambar. Menurut OpenAai, ini berarti bahwa Anda tidak hanya dapat memahami data visual, tetapi juga dapat berintegrasi langsung ke dalam proses berpikir Anda. Model dapat memahami dan menganalisis gambar yang diunggah seperti papan tulis, sketsa dan diagram, bahkan jika berkualitas lebih sedikit.
Keterampilan multimodal ini melampaui pemrosesan gambar murni. Model dapat mengurangi atau mengubah gambar, menggabungkannya dengan alat lain dan memasukkannya ke dalam pemikiran mereka untuk menarik kesimpulan yang ditentukan dengan baik. Integrasi data visual ini ke dalam proses berpikir merupakan kemajuan yang signifikan dibandingkan dengan model AI sebelumnya.
Kinerja dan tolok ukur
O3 sebagai model andalan
Openai O3 digambarkan sebagai model penalaran perusahaan yang paling kuat, yang menetapkan standar baru di bidang -bidang seperti pemrograman, matematika, ilmu alam dan persepsi visual. Dalam evaluasi oleh para ahli eksternal, O3 membuat kesalahan sekitar 20 persen lebih sedikit daripada pendahulunya O1 dalam tugas -tugas nyata yang kompleks.
Dalam berbagai tolok ukur, O3 menunjukkan hasil yang mengesankan:
- Itu mencapai nilai terbaik baru untuk kodefors dan swe-bench
- Ini menetapkan standar baru dalam tolok ukur MMMU untuk pemahaman multimodal tentang pemahaman
- Dalam tolok ukur ilmiah seperti GPQA Diamond, yang mengukur pertanyaan di level PhD, O3 mencapai akurasi 87,7% dibandingkan dengan 78% di O1
Model ini menunjukkan kekuatan khusus dalam pemrograman, di bidang konsultasi dan dalam tugas kreatif. Penguji awal menekankan analitisnya yang ketat sebagai mitra berpikir dan menekankan kemampuannya untuk menghasilkan dan mengevaluasi secara kritis hipotesis baru - terutama dalam konteks biologis, matematika dan teknis.
O4-mini sebagai alternatif yang hemat biaya
O4-Mini adalah model yang lebih kecil yang telah dioptimalkan untuk pemrosesan cepat dan hemat biaya. Meskipun ukurannya lebih rendah, ia mencapai pencapaian yang luar biasa, terutama di bidang matematika, pemrograman, dan tugas visual.
Ini adalah model paling kuat dalam tolok ukur AIME 2024 dan 2025. Di AIME 2025, bahkan mencapai akurasi yang mengesankan sebesar 99,5 persen dengan akses ke penerjemah Python. Dalam evaluasi ahli, ini juga melebihi pendahulunya O3-mini di bidang non-mint dan dalam ilmu data.
Berkat efisiensinya, O4-Mini mendukung batas penggunaan yang jauh lebih tinggi daripada O3, yang menjadikannya pilihan yang kuat untuk aplikasi dengan volume tinggi dan throughput yang mendapat manfaat dari pemikiran logis.
Bidang aplikasi dan ketersediaan
Kemungkinan kegunaannya
Dengan keterampilan mereka yang lebih baik, model -model baru ini membuka berbagai aplikasi:
- Solusi masalah yang kompleks dalam sains dan teknologi, di mana kemampuan mereka untuk membongkar masalah menjadi langkah parsial sangat berharga
- Tugas Pemrograman dan Pengembangan Perangkat Lunak, di mana Anda dapat mendukung kodegenisasi dan pemecahan masalah
- Analisis matematika dan ilmiah di tingkat tinggi
- Analisis visual diagram, grafik dan gambar
- Aplikasi Berbasis Agen di mana AI secara mandiri menggunakan alat yang berbeda untuk menyelesaikan tugas
Ketersediaan untuk pengguna
Model baru secara bertahap tersedia untuk berbagai grup pengguna:
- Chatgpt Plus, pengguna pro dan tim memiliki akses ke O3, O4-Mini dan O4-Mini-tinggi di pemilih model sejak 16 April 2025, di mana
- Chatgpt Enterprise dan User EDU menerima akses dalam waktu seminggu setelah publikasi
- Pengguna gratis dapat mencoba O4-Mini dengan memilih "Think" di komposer sebelum mengirim permintaan Anda
- Batas tarif untuk semua rencana tetap tidak berubah dibandingkan dengan model sebelumnya
Cocok untuk:
Aspek keamanan dan pengembangan lebih lanjut
Keamanan dan Ketahanan: Look Behind Openai's New Models
Openai menekankan bahwa kedua model telah mengalami tes keamanan yang luas - menurut perusahaan, ini adalah program keamanan paling komprehensif sejauh ini. Keterampilan penalaran progresif model menawarkan cara baru untuk meningkatkan keamanan dan ketahanan. Secara khusus, model dapat memikirkan pedoman keamanan OpenAi jika mereka bereaksi terhadap pertanyaan yang berpotensi tidak aman - sebuah konsep yang disebut "perataan deliberatif".
Publikasi berlangsung di bawah versi 2 dari "Kerangka Kesiapsiagaan" oleh OpenAai. Kelompok Penasihat Keselamatan Perusahaan (SAG) memeriksa hasil evaluasi kesiapsiagaan dan sampai pada kesimpulan bahwa O3 dan O4-mini di tidak dari tiga kategori yang dipantau (keterampilan biologis dan kimia, kedap cyber dan peningkatan diri AI) mencapai ambang batas "tinggi".
Artinya untuk lanskap AI
Pengenalan O3 dan O4-Mini adalah langkah signifikan dalam evolusi sistem AI. Dengan kemampuan mereka yang lebih baik untuk secara logis berpikir dan mengintegrasikan alat yang berbeda, model-model ini mendekati sistem berbasis agen yang dapat secara mandiri menyelesaikan tugas-tugas kompleks.
Dengan model -model ini, OpenAai terus memposisikan dirinya di kepala pengembangan AI, yang juga digarisbawahi oleh putaran pembiayaan baru -baru ini, yang perusahaan memberi peringkat $ 300 miliar. Kombinasi dari peningkatan yang lebih baik, integrasi alat dan keterampilan multimodal dapat secara signifikan memperluas area aplikasi AI dan membuka bidang aplikasi baru.
O3 dan O4-Mini: Model AI yang kuat untuk tantangan kompleks
Dengan O3 dan O4-Mini, Openai telah menyajikan model AI baru, yang, berkat kemampuan reaksi yang ditingkatkan dan integrasi berbagai alat, adalah kemajuan yang signifikan dalam pengembangan AI. Model -model tersebut ditandai dengan kemampuan mereka untuk memikirkan masalah yang kompleks dan menggunakan berbagai alat untuk menemukan solusi. Sementara O3 diposisikan sebagai model andalan untuk tugas yang menuntut, O4-Mini menawarkan alternatif yang hemat biaya yang, meskipun ukurannya lebih rendah, mencapai kinerja yang mengesankan.
Model -model baru sudah tersedia untuk berbagai kelompok pengguna Chatters dan dapat memperluas spektrum aplikasi AI berkat keterampilan mereka yang lebih baik. Pada saat yang sama, Openai menekankan pentingnya aspek keamanan dan telah membuat model -model tersebut melakukan tes ekstensif untuk meminimalkan risiko potensial. Pengembangan O3 dan O4-Mini menandai langkah penting menuju sistem AI berbasis agen, yang dapat semakin menguasai tugas-tugas kompleks secara mandiri.
Cocok untuk:
Mitra pemasaran global dan pengembangan bisnis Anda
☑️ Bahasa bisnis kami adalah Inggris atau Jerman
☑️ BARU: Korespondensi dalam bahasa nasional Anda!
Saya akan dengan senang hati melayani Anda dan tim saya sebagai penasihat pribadi.
Anda dapat menghubungi saya dengan mengisi formulir kontak atau cukup hubungi saya di +49 89 89 674 804 (Munich) . Alamat email saya adalah: wolfenstein ∂ xpert.digital
Saya menantikan proyek bersama kita.