⭐️ Kecerdasan Buatan (AI) - Blog AI, hotspot, dan pusat konten ⭐️ Kecerdasan Digital ⭐️ Pers - Pekerjaan pers Xpert | Saran dan penawaran ⭐️ XPaper

Pemilihan suara 📢

Chatgpt menjadi agen super-ki: Model AI baru Openai O3 dan O4-Mini Berpikir Sekarang!

Diterbitkan pada: 17 April 2025 / Pembaruan Dari: 17 April 2025 - Penulis: Konrad Wolfenstein

Chatgpt menjadi agen super-ki: Model AI baru Openai O3 dan O4-Mini Berpikir Sekarang! - Gambar: xpert.digital

Lebih Cerdas Dari Sebelumnya: Seri O Openaai terkesan dengan keterampilan baru

Matematika, Pemrograman & Lainnya: O4-Mini Openai adalah AI Wonder Child baru! - O3 Openai memahami gambar & memecahkan masalah tidak seperti sebelumnya!

Pada 16 April 2025, Openai mempresentasikan dua model AI baru dalam O O O-O3 dan O4-Mini-nya. Ini disebut sebagai model perusahaan yang paling cerdas dan paling kuat. Sistem baru ditandai dengan peningkatan keterampilan berpikir dan dapat menggunakan dan menggabungkan semua alat yang tersedia di Chatt untuk pertama kalinya. Mereka secara khusus dilatih untuk dipikirkan lebih lama sebelum generasi jawaban, yang membuat mereka sangat efektif dalam tugas -tugas kompleks seperti pemrograman, matematika dan analisis visual.

Cocok untuk:

Chatgpt mendapatkan memori dan sekarang mengingat semuanya (hampir): Fungsi memori baru secara rinci

Model O-Series baru sekilas

Properti dan Keterampilan Dasar

O-series dari OpenAI mewakili perubahan paradigma dalam pengembangan AI. Model -model dilatih menggunakan pembelajaran penguatan untuk melakukan proses berpikir yang lebih lama sebelum generasi jawaban. Pendekatan ini memungkinkan model untuk mencoba strategi solusi yang berbeda, mengenali kesalahan dan membongkar masalah kompleks menjadi sub -step yang lebih sederhana.

Inovasi yang signifikan pada O3 dan O4-Mini adalah kemampuan untuk menggunakan semua alat Chattt yang tersedia secara mandiri dan berbasis agen. Ini termasuk pencarian web, analisis data berbasis python, pemrosesan gambar, pembuatan gambar, kanvas, otomatisasi, pencarian file dan fungsi memori. Alat -alat ini diintegrasikan langsung ke dalam proses berpikir model untuk memperluas keterampilan mereka dan mengelola tugas yang lebih kompleks.

Model dapat memutuskan sendiri kapan dan bagaimana mereka menggunakan alat ini dan biasanya memberikan jawaban dalam waktu kurang dari satu menit, bahkan dengan masalah yang lebih kompleks. Ini menandai langkah penting menuju chatt berbasis agen yang dapat melakukan tugas secara mandiri.

Pemahaman visual dan keterampilan multimodal

Properti yang sangat luar biasa dari model baru adalah kemampuan mereka untuk "berpikir" dengan gambar. Menurut OpenAai, ini berarti bahwa Anda tidak hanya dapat memahami data visual, tetapi juga dapat berintegrasi langsung ke dalam proses berpikir Anda. Model dapat memahami dan menganalisis gambar yang diunggah seperti papan tulis, sketsa dan diagram, bahkan jika berkualitas lebih sedikit.

Keterampilan multimodal ini melampaui pemrosesan gambar murni. Model dapat mengurangi atau mengubah gambar, menggabungkannya dengan alat lain dan memasukkannya ke dalam pemikiran mereka untuk menarik kesimpulan yang ditentukan dengan baik. Integrasi data visual ini ke dalam proses berpikir merupakan kemajuan yang signifikan dibandingkan dengan model AI sebelumnya.

Kinerja dan tolok ukur

O3 sebagai model andalan

Openai O3 digambarkan sebagai model penalaran perusahaan yang paling kuat, yang menetapkan standar baru di bidang -bidang seperti pemrograman, matematika, ilmu alam dan persepsi visual. Dalam evaluasi oleh para ahli eksternal, O3 membuat kesalahan sekitar 20 persen lebih sedikit daripada pendahulunya O1 dalam tugas -tugas nyata yang kompleks.

Dalam berbagai tolok ukur, O3 menunjukkan hasil yang mengesankan:

Itu mencapai nilai terbaik baru untuk kodefors dan swe-bench
Ini menetapkan standar baru dalam tolok ukur MMMU untuk pemahaman multimodal tentang pemahaman
Dalam tolok ukur ilmiah seperti GPQA Diamond, yang mengukur pertanyaan di level PhD, O3 mencapai akurasi 87,7% dibandingkan dengan 78% di O1

Model ini menunjukkan kekuatan khusus dalam pemrograman, di bidang konsultasi dan dalam tugas kreatif. Penguji awal menekankan analitisnya yang ketat sebagai mitra berpikir dan menekankan kemampuannya untuk menghasilkan dan mengevaluasi secara kritis hipotesis baru - terutama dalam konteks biologis, matematika dan teknis.

O4-mini sebagai alternatif yang hemat biaya

O4-Mini adalah model yang lebih kecil yang telah dioptimalkan untuk pemrosesan cepat dan hemat biaya. Meskipun ukurannya lebih rendah, ia mencapai pencapaian yang luar biasa, terutama di bidang matematika, pemrograman, dan tugas visual.

Ini adalah model paling kuat dalam tolok ukur AIME 2024 dan 2025. Di AIME 2025, bahkan mencapai akurasi yang mengesankan sebesar 99,5 persen dengan akses ke penerjemah Python. Dalam evaluasi ahli, ini juga melebihi pendahulunya O3-mini di bidang non-mint dan dalam ilmu data.

Berkat efisiensinya, O4-Mini mendukung batas penggunaan yang jauh lebih tinggi daripada O3, yang menjadikannya pilihan yang kuat untuk aplikasi dengan volume tinggi dan throughput yang mendapat manfaat dari pemikiran logis.

Bidang aplikasi dan ketersediaan

Kemungkinan kegunaannya

Dengan keterampilan mereka yang lebih baik, model -model baru ini membuka berbagai aplikasi:

Solusi masalah yang kompleks dalam sains dan teknologi, di mana kemampuan mereka untuk membongkar masalah menjadi langkah parsial sangat berharga
Tugas Pemrograman dan Pengembangan Perangkat Lunak, di mana Anda dapat mendukung kodegenisasi dan pemecahan masalah
Analisis matematika dan ilmiah di tingkat tinggi
Analisis visual diagram, grafik dan gambar
Aplikasi Berbasis Agen di mana AI secara mandiri menggunakan alat yang berbeda untuk menyelesaikan tugas

Ketersediaan untuk pengguna

Model baru secara bertahap tersedia untuk berbagai grup pengguna:

Chatgpt Plus, pengguna pro dan tim memiliki akses ke O3, O4-Mini dan O4-Mini-tinggi di pemilih model sejak 16 April 2025, di mana
Chatgpt Enterprise dan User EDU menerima akses dalam waktu seminggu setelah publikasi
Pengguna gratis dapat mencoba O4-Mini dengan memilih "Think" di komposer sebelum mengirim permintaan Anda
Batas tarif untuk semua rencana tetap tidak berubah dibandingkan dengan model sebelumnya

Cocok untuk:

Perkembangan saat ini di Chatgpt von Openaai (Maret 2025)

Aspek keamanan dan pengembangan lebih lanjut

Keamanan dan Ketahanan: Look Behind Openai's New Models

Openai menekankan bahwa kedua model telah mengalami tes keamanan yang luas - menurut perusahaan, ini adalah program keamanan paling komprehensif sejauh ini. Keterampilan penalaran progresif model menawarkan cara baru untuk meningkatkan keamanan dan ketahanan. Secara khusus, model dapat memikirkan pedoman keamanan OpenAi jika mereka bereaksi terhadap pertanyaan yang berpotensi tidak aman - sebuah konsep yang disebut "perataan deliberatif".

Publikasi berlangsung di bawah versi 2 dari "Kerangka Kesiapsiagaan" oleh OpenAai. Kelompok Penasihat Keselamatan Perusahaan (SAG) memeriksa hasil evaluasi kesiapsiagaan dan sampai pada kesimpulan bahwa O3 dan O4-mini di tidak dari tiga kategori yang dipantau (keterampilan biologis dan kimia, kedap cyber dan peningkatan diri AI) mencapai ambang batas "tinggi".

Artinya untuk lanskap AI

Pengenalan O3 dan O4-Mini adalah langkah signifikan dalam evolusi sistem AI. Dengan kemampuan mereka yang lebih baik untuk secara logis berpikir dan mengintegrasikan alat yang berbeda, model-model ini mendekati sistem berbasis agen yang dapat secara mandiri menyelesaikan tugas-tugas kompleks.

Dengan model -model ini, OpenAai terus memposisikan dirinya di kepala pengembangan AI, yang juga digarisbawahi oleh putaran pembiayaan baru -baru ini, yang perusahaan memberi peringkat $ 300 miliar. Kombinasi dari peningkatan yang lebih baik, integrasi alat dan keterampilan multimodal dapat secara signifikan memperluas area aplikasi AI dan membuka bidang aplikasi baru.

O3 dan O4-Mini: Model AI yang kuat untuk tantangan kompleks

Dengan O3 dan O4-Mini, Openai telah menyajikan model AI baru, yang, berkat kemampuan reaksi yang ditingkatkan dan integrasi berbagai alat, adalah kemajuan yang signifikan dalam pengembangan AI. Model -model tersebut ditandai dengan kemampuan mereka untuk memikirkan masalah yang kompleks dan menggunakan berbagai alat untuk menemukan solusi. Sementara O3 diposisikan sebagai model andalan untuk tugas yang menuntut, O4-Mini menawarkan alternatif yang hemat biaya yang, meskipun ukurannya lebih rendah, mencapai kinerja yang mengesankan.

Model -model baru sudah tersedia untuk berbagai kelompok pengguna Chatters dan dapat memperluas spektrum aplikasi AI berkat keterampilan mereka yang lebih baik. Pada saat yang sama, Openai menekankan pentingnya aspek keamanan dan telah membuat model -model tersebut melakukan tes ekstensif untuk meminimalkan risiko potensial. Pengembangan O3 dan O4-Mini menandai langkah penting menuju sistem AI berbasis agen, yang dapat semakin menguasai tugas-tugas kompleks secara mandiri.

Cocok untuk:

Mitra pemasaran global dan pengembangan bisnis Anda

☑️ Bahasa bisnis kami adalah Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa nasional Anda!

Konrad Wolfenstein

Saya akan dengan senang hati melayani Anda dan tim saya sebagai penasihat pribadi.

Anda dapat menghubungi saya dengan mengisi formulir kontak atau cukup hubungi saya di +49 89 89 674 804 (Munich) . Alamat email saya adalah: wolfenstein ∂ xpert.digital

Saya menantikan proyek bersama kita.