Begitu GPT-5.3 diluncurkan, semua orang sudah membicarakan GPT-5.4: Extreme Reasoning & 2 Million Tokens

Konrad Wolfenstein

3 bulan yang lalu

Begitu GPT-5.3 diluncurkan, semua orang sudah membicarakan GPT-5.4: Extreme Reasoning & 2 Million Tokens – Gambar: Xpert.Digital

Lompatan kuantum untuk OpenAI? Raksasa AI tersembunyi: Bagaimana OpenAI bertujuan mengungguli Google dan Anthropic dengan GPT-5.4

Bocoran tak sengaja: Mega-model baru OpenAI, GPT-5.4, akan segera dirilis

Sebuah cuitan singkat berisi lima kata dan cuplikan kode yang dihapus terburu-buru di GitHub telah mengguncang dunia teknologi global: OpenAI tampaknya sedang bersiap untuk meluncurkan model bahasa utamanya berikutnya – GPT-5.4. Apa yang awalnya tampak seperti pembaruan bertahap yang tidak mencolok, setelah diperiksa lebih dekat ternyata merupakan tonggak penting dalam pertempuran sengit untuk supremasi AI. Dengan fitur-fitur inovatif seperti mode "Extreme Reasoning" yang intensif secara komputasi, jendela konteks yang sangat besar hingga dua juta token, dan analisis gambar yang sangat presisi, perusahaan ini mempersenjatai diri untuk mengungguli pesaing seperti Google dan Anthropic. Namun, siklus rilis yang dipercepat ini memiliki harga: Sementara model-model tersebut menjadi semakin otonom dan berevolusi menjadi agen sejati, biaya infrastruktur meroket – dan di tengah kesepakatan Pentagon yang kontroversial, kelayakan etis dan ekonomi dari kemajuan pesat ini semakin menjadi fokus.

GPT-5.4: Lompatan kuantum OpenAI berikutnya antara Penalaran Ekstrem dan pertempuran untuk supremasi AI

Jika lima kata tentang X sudah cukup untuk membuat seluruh industri AI gempar, maka yang dipertaruhkan bukan hanya model baru

Itu adalah pesan yang sangat singkat, namun mengguncang seluruh industri kecerdasan buatan. Pada 3 Maret 2026, tepat satu jam setelah OpenAI merilis model bahasa barunya, GPT-5.3 Instant, kepada pengguna umum, sebuah unggahan lima kata muncul di saluran X resmi perusahaan, yang mendapatkan tiga juta tayangan dan 25.000 suka dalam hitungan jam: "5.4 lebih cepat dari yang Anda duga." Tidak ada gambar, tidak ada penjelasan, tidak ada tautan ke unggahan blog. Hanya lima kata dan huruf T kapital yang mencolok yang langsung menggerakkan mesin spekulasi komunitas pengembang dan investor global. Apa yang pada pandangan pertama tampak seperti teaser yang didorong oleh pemasaran, setelah diperiksa lebih dekat, ternyata merupakan konfirmasi publik paling jelas hingga saat ini bahwa OpenAI sedang mempersiapkan model dengan GPT-5.4 yang secara fundamental dapat mengubah aturan persaingan AI.

Tweet tersebut tidak muncul begitu saja. Tweet itu muncul setelah seminggu di mana tiga kebocoran independen dari repositori Codex milik OpenAI sendiri mengungkapkan cara kerja internal model yang akan datang sebelum para insinyur yang buru-buru menghapus jejak mereka dapat menutupi jejak tersebut. Dan seperti yang dilaporkan majalah teknologi The Information, mengutip seseorang yang mengetahui rencana tersebut, GPT-5.4 akan mencakup mode penalaran "Ekstrem", yang memungkinkan model tersebut untuk menggunakan daya komputasi yang jauh lebih besar daripada pendahulunya ketika menangani masalah kompleks. Apa yang awalnya terdengar seperti pembaruan bertahap berpotensi untuk membentuk kembali dinamika kekuasaan antara OpenAI, Google, dan Anthropic, semakin menekan struktur biaya infrastruktur AI, dan menimbulkan pertanyaan apakah model bisnis di balik model-model yang semakin canggih ini berkelanjutan dalam jangka panjang.

Anatomi sebuah wahyu yang tidak disengaja

Kisah GPT-5.4 tidak dimulai dengan siaran pers yang direncanakan, tetapi dengan kesalahan yang terulang dengan frekuensi yang mengkhawatirkan di dunia pengembangan perangkat lunak: Seorang insinyur menulis kode yang mengungkapkan lebih dari yang seharusnya. Pada 28 Februari 2026, sebuah permintaan pull dengan penunjukan internal 13050 muncul di repositori Codex yang dapat diakses publik di GitHub. Permintaan tersebut berisi pengecekan versi yang secara eksplisit merujuk pada "GPT-5.4 atau yang lebih baru" sebagai persyaratan minimum untuk fitur pemrosesan gambar baru. Komunitas menemukan entri tersebut dalam beberapa jam. Baris yang dimaksud dengan tergesa-gesa diubah menjadi "gpt-5.3-codex atau yang lebih baru," dan riwayat commit ditimpa melalui force push, tetapi pada saat itu, tangkapan layar sudah beredar luas di X dan Reddit.

Poin penting dari kebocoran ini adalah bahwa itu bukan sekadar placeholder. Kode tersebut mengimplementasikan fungsi spesifik, yaitu pemrosesan gambar beresolusi penuh, yang secara teknis hanya berfungsi dengan kemampuan GPT-5.4. Insinyur tersebut menulis pengecekan versi karena fitur tersebut tidak akan berjalan pada model yang lebih lama. Itu adalah referensi fungsional, bukan spekulatif.

Beberapa hari kemudian, pada tanggal 2 Maret, permintaan pull request kedua, nomor 13212, menyusul, yang semakin memperjelas masalah tersebut. Seorang pengembang OpenAI dengan nama pengguna pash-openai menambahkan fungsi pengaktifan/penonaktifan mode cepat ke terminal Codex. Deskripsinya secara eksplisit merujuk pada "aktifkan/nonaktifkan mode Cepat untuk GPT-5.4" dan memperkenalkan apa yang disebut enumerasi ServiceTier dengan varian Standar dan Cepat. Referensi ini juga dihapus dalam beberapa jam, tetapi detail teknisnya telah didokumentasikan.

Secara paralel, seorang karyawan OpenAI bernama Tibo menyebabkan kebocoran yang tidak disengaja lainnya ketika ia memposting tangkapan layar pemilihan model di aplikasi Codex, yang menunjukkan GPT-5.4 sebagai opsi yang dapat dipilih bersama dengan GPT-5.3 Codex. Postingan tersebut segera dihapus, tetapi gambar tersebut sudah menjadi viral. Akhirnya, pengembang nicdunz melaporkan di X bahwa sebuah endpoint berlabel "alpha-gpt-5.4" telah muncul sementara dalam daftar model API publik, sesuai dengan praktik OpenAI yang biasa menguji model di endpoint alpha sebelum rilis resminya.

Jika digabungkan, keempat titik data independen ini—dua commit kode, tangkapan layar karyawan, dan titik akhir API—menggambarkan gambaran yang jauh melampaui sekadar spekulasi. GPT-5.4 ada secara internal di OpenAI, sedang dalam pengembangan tingkat lanjut, dan sedang dipersiapkan secara aktif untuk penerapan produksi.

Janji dua juta token dan keterbatasannya

Klaim paling signifikan secara teknis yang berasal dari referensi kode yang bocor berkaitan dengan jendela konteks. Analisis NxCode terhadap commit yang bocor menunjukkan jendela konteks sebesar dua juta token, yang akan lima kali lipat dari batas 400.000 token pada model unggulan GPT-5 saat ini dan delapan kali lipat dari 256.000 token pada GPT-5.3 Codex. Untuk memberikan gambaran, dua juta token kira-kira setara dengan 5.000 halaman cetak—cukup untuk memproses seluruh basis kode, proses hukum yang panjang dengan semua dokumen pendukungnya, atau makalah ilmiah multi-volume dalam satu sesi.

Namun, perlu dibedakan secara signifikan di sini. Meskipun bocoran kode menunjukkan dua juta token, The Information, mengutip sumber yang mengetahui rencana tersebut, melaporkan jendela konteks sebesar satu juta token. Ini masih akan mewakili peningkatan dua hingga empat kali lipat dari pendahulunya dan akan menempatkan OpenAI setara dengan Gemini 2.5 Pro milik Google, yang saat ini menawarkan jendela konteks terbesar yang tersedia secara komersial dengan satu juta token. Tinjauan cermat terhadap sumber-sumber mengungkapkan bahwa angka dua juta berasal dari satu unggahan influencer dan tidak dikonfirmasi secara langsung oleh salah satu dari empat bocoran kode yang terdokumentasi, sedangkan angka satu juta berasal dari publikasi teknis yang mapan.

Terlepas dari angka mana yang pada akhirnya terbukti benar, implikasinya akan tetap sama: OpenAI menutup salah satu kesenjangan paling mencoloknya dengan para pesaing. Model Gemini Google telah lama menawarkan jendela kontekstual yang jauh lebih besar daripada apa pun yang ditawarkan OpenAI, dan Claude Opus 4.6 dari Anthropic, yang diluncurkan pada awal Februari 2026 dengan jendela satu juta token dan dukungan untuk tim agen paralel, semakin memperkuat keunggulan ini. GPT 5.4 dengan satu atau bahkan dua juta token akan secara fundamental mengubah keseimbangan kekuatan ini.

Penerapan praktis dari lompatan tersebut sangat beragam dan meluas jauh melampaui tolok ukur akademis. Firma hukum dapat memproses seluruh berkas kasus dalam satu jendela percakapan. Tim pengembangan perangkat lunak akan dapat memuat seluruh basis kode untuk analisis dan refactoring multi-berkas tanpa harus memecah kode. Tim peneliti dapat memasukkan korpus literatur lengkap untuk sintesis. Transisi dari ratusan ribu menjadi jutaan token bukanlah hal yang bertahap; hal itu secara fundamental mengubah tugas mana yang bahkan dapat dilakukan dalam satu interaksi model.

Penalaran Ekstrem: Ketika AI membutuhkan lebih banyak waktu untuk berpikir

Selain lompatan ke jendela konteks, mode penalaran "Ekstrem" yang diumumkan adalah fitur utama kedua dari GPT-5.4. Seperti yang dilaporkan oleh The Information, ini adalah fungsi yang memungkinkan model untuk mengalokasikan daya komputasi yang jauh lebih besar untuk pertanyaan-pertanyaan sulit, sehingga memungkinkan analisis kognitif yang lebih mendalam. Menurut informasi yang tersedia, mode ini terutama ditujukan untuk peneliti dan bukan pengguna biasa yang mengharapkan jawaban cepat.

Ide di balik mode Extreme Reasoning dibangun di atas tren yang telah muncul sejak OpenAI memperkenalkan seri model penalaran o: pergeseran upaya komputasi yang ditargetkan dari fase pelatihan ke fase inferensi. Alih-alih hanya membuat model lebih kuat melalui pelatihan yang lebih ekstensif, model tersebut dapat menginvestasikan lebih banyak waktu dan sumber daya komputasi dalam pembuatan jawaban yang sebenarnya. Dalam kasus GPT-5.4, ini berarti bahwa model dapat menangani tuntutan komputasi yang jauh lebih tinggi untuk masalah ilmiah, matematika, atau teknis yang sangat kompleks, sehingga menghasilkan analisis yang lebih tepat dan mendalam.

Huruf T kapital dalam cuitan OpenAI telah memicu spekulasi luas di komunitas bahwa GPT-5.4 akan menjadi model yang disebut kelas Thinking. OpenAI sendiri telah membedakan berbagai kelas model secara internal: model Thinking untuk penalaran mendalam, model Codex untuk pengembangan perangkat lunak berbasis agen, dan model Instant untuk penggunaan percakapan sehari-hari. Oleh karena itu, huruf T kapital tersebut kemungkinan merupakan referensi yang disengaja terhadap nama merek Thinking-Mode internal. Interpretasi ini masuk akal, tetapi masih belum terkonfirmasi.

Implikasi konkret dari peningkatan kemampuan penalaran ini bagi pengguna bisnis dapat diilustrasikan melalui skenario spesifik. Dalam penelitian farmasi, mode penalaran ekstrem dapat secara signifikan memperdalam analisis interaksi obat. Dalam analisis keuangan, struktur derivatif kompleks atau model makroekonomi dapat diperiksa dengan teliti yang sebelumnya membutuhkan banyak interaksi model secara berurutan. Dalam pengembangan perangkat lunak, bug dalam sistem bersarang dapat diidentifikasi, bug yang sebelumnya menimbulkan kesulitan sistematis bagi model tersebut.

Analisis gambar setingkat piksel: Akhir dari kompromi

Terobosan teknis ketiga, yang didokumentasikan oleh permintaan pull yang bocor, berkaitan dengan pemrosesan gambar. Kode dalam PR 13050 menambahkan flag fitur yang secara langsung dan tanpa kompresi meneruskan data gambar asli dalam format PNG, JPEG, dan WebP ke API Respons, yang dikendalikan oleh parameter API baru, "detail: original". Persyaratan versi minimum untuk fitur ini adalah 5.4, yang berarti ini adalah ekstensi khusus GPT 5.4 dan tidak dapat di-backport ke versi yang lebih lama.

Model GPT saat ini mengompres gambar yang diunggah sebelum diproses, yang mengurangi kualitas analisis untuk tugas-tugas yang membutuhkan presisi tingkat piksel. Ini termasuk pencitraan medis, citra satelit, pengenalan karakter optik (OCR) dalam dokumen, peninjauan rencana arsitektur dan skema teknis, serta kontrol kualitas maket desain dan antarmuka pengguna. Kemampuan untuk memproses gambar resolusi penuh akan melambungkan GPT-5.4 ke berbagai bidang aplikasi profesional di mana model sebelumnya telah mencapai batasnya karena kompresi gambar.

Bagi perusahaan yang menggunakan jaminan kualitas berbasis AI di bidang manufaktur, pemrosesan dokumen otomatis di sektor hukum atau keuangan, atau diagnostik berbasis gambar di bidang kedokteran, ini akan menjadi lompatan maju yang memberikan manfaat praktis langsung. Bukan kebetulan bahwa OpenAI secara eksplisit mengaitkan fitur ini dengan GPT-5.4: Pemrosesan gambar beresolusi tinggi yang tidak terkompresi membutuhkan daya komputasi dan bandwidth memori yang jauh lebih besar, yang meningkatkan tuntutan teknis pada model dan infrastruktur yang mendasarinya.

Menentukan kecepatan perlombaan: Frekuensi rilis yang dipercepat dari OpenAI

Salah satu aspek yang setidaknya sama pentingnya dengan spesifikasi teknis dalam diskusi seputar GPT-5.4 menyangkut kecepatan OpenAI dalam merilis varian model baru. Sejak peluncuran GPT-5 pada 7 Agustus 2025, perusahaan telah merilis lebih banyak varian dalam seri GPT-5 daripada selama seluruh era GPT-4 dalam jangka waktu yang sebanding.

Kronologi tersebut menggambarkan percepatan: GPT-5 dirilis pada Agustus 2025, GPT-5.1 menyusul pada November 2025 setelah jeda tiga bulan, GPT-5.2 tiba pada Desember 2025 setelah hanya satu bulan, GPT-5.3 Codex dirilis pada 5 Februari 2026, GPT-5.3 Codex Spark menyusul seminggu kemudian pada 13 Februari, dan GPT-5.3 Instant diluncurkan pada 3 Maret 2026. Jika GPT-5.4 benar-benar dirilis pada Maret atau April, jeda akan berkurang menjadi sekitar satu bulan. Pasar prediksi di Manifold memberikan model tersebut probabilitas 55 persen untuk rilis sebelum April 2026 dan probabilitas 74 persen sebelum Juni.

Menurut The Information, percepatan ini merupakan keputusan strategis yang disengaja. Rilis model yang lebih sering dimaksudkan untuk menjaga ekspektasi pengguna tetap terkendali. Hype seputar peluncuran GPT-5 telah menetapkan standar yang sangat tinggi sehingga hampir mustahil untuk dilampaui, dan pertumbuhan pengguna OpenAI baru-baru ini kurang dari proyeksi internal. Dengan terus menghadirkan peningkatan baru secara bertahap, daripada berfokus pada satu rilis utama, perusahaan dapat mempertahankan perhatian industri tanpa risiko satu peristiwa yang mengecewakan.

Namun, strategi ini juga memiliki sisi negatif. Para pengembang yang membangun aplikasi berdasarkan API OpenAI semakin sering melaporkan kelelahan migrasi. Pergantian varian model baru yang cepat memerlukan siklus evaluasi berulang dan penyesuaian pada sistem mereka sendiri. Bagi perusahaan yang menjalankan aplikasi AI di lingkungan produksi, muncul pertanyaan apakah upaya pembaruan terus-menerus sebanding dengan manfaat dari setiap peningkatan bertahap.

Dimensi baru transformasi digital dengan 'Managed AI' (Kecerdasan Buatan) - Platform & solusi B2B | Xpert Consulting

Dimensi baru transformasi digital dengan 'Managed AI' (Kecerdasan Buatan) – Platform & solusi B2B | Xpert Consulting - Gambar: Xpert.Digital

Di sini Anda akan mempelajari bagaimana perusahaan Anda dapat mengimplementasikan solusi AI yang disesuaikan dengan cepat, aman, dan tanpa hambatan masuk yang tinggi.

Platform AI terkelola adalah solusi lengkap dan bebas khawatir Anda untuk kecerdasan buatan. Alih-alih berurusan dengan teknologi yang kompleks, infrastruktur yang mahal, dan proses pengembangan yang panjang, Anda menerima solusi siap pakai yang disesuaikan dengan kebutuhan Anda dari mitra khusus – seringkali hanya dalam beberapa hari.

Keunggulan utama secara sekilas:

⚡ Implementasi cepat: Dari ide hingga aplikasi siap pakai dalam hitungan hari, bukan bulan. Kami menghadirkan solusi praktis yang menciptakan nilai tambah langsung.

🔒 Keamanan data maksimal: Data sensitif Anda tetap aman. Kami menjamin pemrosesan yang aman dan sesuai peraturan tanpa membagikan data dengan pihak ketiga.

💸 Tanpa risiko finansial: Anda hanya membayar untuk hasil. Investasi awal yang tinggi untuk perangkat keras, perangkat lunak, atau personel sepenuhnya dihilangkan.

🎯 Fokus pada bisnis inti Anda: Konsentrasikan pada apa yang Anda kuasai. Kami mengurus seluruh implementasi teknis, pengoperasian, dan pemeliharaan solusi AI Anda.

📈 Tahan masa depan & dapat diskalakan: AI Anda tumbuh bersama Anda. Kami memastikan optimasi dan skalabilitas berkelanjutan, serta secara fleksibel menyesuaikan model dengan kebutuhan baru.

Informasi selengkapnya di sini:

Solusi AI Terkelola - Layanan AI Industri: Kunci Daya Saing di Sektor Jasa, Industri, dan Teknik Mesin

Persaingan AI semakin memanas: Bagaimana GPT-5.4 berupaya mengungguli Google dan Anthropic

Lanskap persaingan: Tiga perusahaan, satu perlombaan, tanpa pemenang yang jelas

Persaingan AI semakin memanas: Bagaimana GPT-5.4 berupaya mengungguli Google dan Anthropic

Pengumuman GPT-5.4 hadir pada saat persaingan di antara tiga laboratorium AI terkemuka telah mencapai tingkat intensitas yang belum pernah terjadi sebelumnya. Pada 5 Februari 2026, OpenAI dan Anthropic merilis model unggulan baru mereka masing-masing dalam waktu satu jam, yang secara jelas menggambarkan dinamika perlombaan senjata ini. Anthropic meluncurkan Claude Opus 4.6, yang menawarkan peningkatan pada penalaran konteks panjang, jendela konteks satu juta token, dan dukungan untuk tim agen paralel, memungkinkan beberapa agen AI untuk bekerja secara bersamaan pada tugas pemrograman dan dokumentasi. OpenAI membalas dengan GPT-5.3 Codex, yang dioptimalkan untuk pemrograman berbasis agen dan pengembangan perangkat lunak.

Hasil uji perbandingan independen menunjukkan bahwa tidak ada model yang dapat mengklaim keunggulan keseluruhan yang jelas, dengan keunggulan kinerja yang bervariasi tergantung pada aplikasinya. Claude Opus 4.6 berkinerja sangat baik dalam penalaran profesional, sementara GPT-5.3-Codex menunjukkan keunggulan dalam pengembangan perangkat lunak otonom. Sementara itu, Gemini 2.5 Pro dari Google memegang rekor untuk pemrosesan berbasis konteks paling ekstensif dengan jendela konteks satu juta token dan menawarkan kemampuan multimodal yang kuat.

GPT-5.4 akan menjadi upaya OpenAI untuk merebut kembali kepemimpinan teknologi di beberapa bidang secara bersamaan: dalam jendela konteks melalui batas satu atau dua juta token yang baru, dalam penalaran melalui mode Ekstrem, dan dalam pemrosesan gambar melalui analisis presisi piksel. Keberhasilan upaya ini sebagian besar bergantung pada seberapa cepat Google dan Anthropic bereaksi dengan pembaruan mereka sendiri. Industri ini beroperasi dengan kecepatan di mana keunggulan teknologi dapat terkikis dalam hitungan minggu.

Untuk pen positioning di pasar perusahaan, faktor lain yang relevan adalah: Menurut analisis industri, Anthropic baru-baru ini memegang pangsa pasar 32 persen dalam penggunaan model bahasa AI di sektor perusahaan, sebuah pembalikan signifikan dari situasi dua tahun lalu ketika OpenAI masih mendominasi dengan 50 persen. Sementara fokus OpenAI pada strategi yang berorientasi konsumen melalui ChatGPT telah memberikan perusahaan basis pengguna yang besar, Anthropic telah membuat kemajuan yang cukup besar di segmen perusahaan yang menguntungkan dengan fokusnya yang konsisten pada alur kerja profesional dan alat-alat seperti Claude Code.

Pentagon, protes, dan krisis kepercayaan

Dimensi teknis GPT-5.4 tidak dapat dipertimbangkan secara terpisah dari konteks politik dan sosial di mana OpenAI saat ini beroperasi. Hanya beberapa hari sebelum pengumuman tersebut, OpenAI telah menandatangani kontrak dengan Departemen Pertahanan AS untuk menyediakan model-modelnya di jaringan rahasia, yang memicu reaksi keras dan langsung.

Latar belakangnya cukup menarik: Anthropic menolak memberikan akses tanpa batas kepada Pentagon terhadap teknologinya, dengan menetapkan batasan penggunaan dalam pengawasan massal dan sistem senjata otonom. Pentagon menanggapi dengan mengklasifikasikan Anthropic sebagai risiko rantai pasokan dan melarang penggunaan Claude di seluruh pemerintahan, yang mendorong Presiden Trump untuk memerintahkan lembaga-lembaga federal agar segera menghentikan penggunaan teknologi Anthropic. OpenAI memanfaatkan kesempatan ini dan mengumumkan perjanjiannya sendiri, yang menurut perusahaan tersebut, berisi jaminan keamanan yang lebih kuat daripada perjanjian sebelumnya untuk penerapan AI rahasia.

Reaksi yang muncul adalah gelombang kemarahan. Sebuah gerakan terbentuk di bawah tagar #CancelChatGPT dan melalui platform quitgpt.org, yang menurut angka mereka sendiri, memobilisasi lebih dari 1,5 juta orang melalui pembatalan langganan, seruan boikot di media sosial, dan pendaftaran di situs web kampanye. Claude untuk sementara menyalip ChatGPT dan menjadi aplikasi gratis yang paling banyak diunduh di Apple App Store. Grafiti kapur yang menyerang perjanjian Pentagon muncul di luar kantor OpenAI di San Francisco, sementara grafiti yang memuji penolakan tersebut muncul di luar kantor Anthropic.

Sam Altman mengakui bahwa tampilan kesepakatan itu tampak "ceroboh," dan OpenAI menerbitkan kutipan dari kontrak tersebut, yang berisi larangan eksplisit terhadap pengawasan domestik massal, sistem senjata otonom sepenuhnya, dan skema kredit sosial. Sebuah surat terbuka yang ditandatangani oleh 796 karyawan Google dan OpenAI memperingatkan bahwa pemerintah AS mencoba untuk "memecah belah perusahaan dengan menanamkan rasa takut bahwa masing-masing akan mundur.".

Dalam konteks ini, peluncuran GPT-5.4 yang dipercepat memiliki dimensi strategis tambahan. Peluncuran model yang mengesankan secara teknologi dapat berfungsi sebagai narasi tandingan terhadap krisis kepercayaan dan mengalihkan perhatian publik dari kemitraan Pentagon yang kontroversial ke kekuatan inovatif perusahaan.

Persamaan ekonomi: Antara pendapatan rekor dan kerugian rekor

Situasi keuangan OpenAI mungkin merupakan faktor paling mendesak yang memengaruhi valuasi GPT-5.4. Perusahaan ini berada dalam posisi paradoks: belum pernah ada perusahaan teknologi yang tumbuh begitu pesat sekaligus mengalami kerugian yang begitu besar.

Pendapatan mencapai $20 miliar per tahun pada tahun 2025, meningkat 233 persen dibandingkan $6 miliar pada tahun sebelumnya dan $2 miliar pada tahun 2023. Total pendapatan aktual untuk tahun 2025 adalah $13 miliar, melebihi perkiraan perusahaan sendiri sebesar $10 miliar, sementara pengeluaran, sebesar $8 miliar, tetap di bawah target $9 miliar. Namun, biaya meningkat secara paralel. Dokumen internal yang diperoleh The Information memproyeksikan kerugian sebesar $14 miliar untuk tahun 2026, kira-kira tiga kali lipat dari perkiraan awal untuk tahun 2025. Untuk periode dari tahun 2023 hingga akhir tahun 2028, OpenAI secara internal mengantisipasi kerugian kumulatif sebesar $44 miliar sebelum mengharapkan keuntungan pertama sebesar $14 miliar pada tahun 2029.

Margin laba kotor berkisar antara 33 hingga 40 persen, jauh lebih rendah daripada perusahaan perangkat lunak tradisional, dan dibatasi oleh biaya komputasi variabel. Biaya inferensi, yaitu biaya menjalankan model secara real-time, mencapai $8,4 miliar pada tahun 2025 dan diproyeksikan meningkat menjadi $14,1 miliar pada tahun 2026. Meskipun OpenAI telah berhasil mengurangi biaya inferensi hingga di bawah satu dolar per juta token, sebagian melalui penggunaan berbagai jenis perangkat keras, skala penggunaan yang sangat besar meniadakan peningkatan efisiensi ini.

Untuk membiayai pengeluaran ini, OpenAI menutup putaran pendanaan swasta terbesar dalam sejarah pada akhir Februari 2026: $110 miliar, dipimpin oleh Amazon dengan $50 miliar, SoftBank dan Nvidia masing-masing dengan $30 miliar, dengan valuasi pra-pendanaan sebesar $730 miliar dan valuasi pasca-pendanaan sebesar $840 miliar. Kapasitas pusat data meningkat tiga kali lipat dari 200 megawatt menjadi 1,9 gigawatt, setara dengan konsumsi listrik sekitar dua juta rumah. Untuk periode hingga 2030, OpenAI menargetkan total pengeluaran kapasitas komputasi sekitar $600 miliar, turun dari perkiraan sebelumnya sebesar $1,4 triliun, yang kemudian direvisi karena dianggap terlalu optimis.

Apa arti GPT-5.4 bagi ekonomi infrastruktur?

Model dengan dua juta token konteks dan mode penalaran ekstrem menuntut infrastruktur komputasi yang jauh lebih tinggi daripada pendahulunya. Jendela konteks yang lebih besar berarti bahwa jauh lebih banyak data harus diproses oleh model dengan setiap permintaan, sehingga meningkatkan kebutuhan penyimpanan dan waktu pemrosesan per permintaan. Mode penalaran ekstrem, yang menurut laporan memungkinkan waktu pemrosesan beberapa jam untuk tugas individual, melipatgandakan upaya komputasi per permintaan berkali-kali lipat dibandingkan dengan operasi inferensi standar.

Bagi OpenAI, ini berarti semakin memburuknya hubungan yang sudah tegang antara pendapatan dan biaya infrastruktur. Setiap model baru membutuhkan daya komputasi yang lebih besar. Setiap peningkatan daya komputasi membutuhkan lebih banyak modal. Setiap peningkatan modal membutuhkan demonstrasi jalur menuju profitabilitas, yang semakin bergeser ke masa depan seiring dengan setiap generasi model. Jika pendapatan sekitar $20 miliar dan total biaya antara $25 dan $28 miliar, ini menghasilkan kerugian tahunan implisit dalam kisaran $5 hingga $8 miliar.

Jawaban strategis untuk dilema ini adalah pendekatan dua arah: Di satu sisi, OpenAI berinvestasi besar-besaran pada perangkat kerasnya sendiri. Kemitraan dengan Broadcom untuk mengembangkan akselerator AI khusus dengan kapasitas sepuluh gigawatt, proyek pusat data Stargate dengan SB Energy milik SoftBank, dan perjanjian dengan Amazon untuk menggunakan chip Trainium dimaksudkan untuk mengurangi biaya dalam jangka panjang. Di sisi lain, OpenAI semakin membedakan penawaran modelnya ke dalam kelas kinerja yang berbeda—Instant untuk penggunaan sehari-hari, Thinking untuk penalaran mendalam, dan Codex untuk pemrograman berbasis agen—untuk mengalokasikan sumber daya komputasi sesuai kebutuhan dan menghindari penggunaan kapasitas model penuh untuk setiap permintaan pengguna.

Pengenalan fitur pengaktifan/penonaktifan mode cepat untuk GPT-5.4, seperti yang terungkap dalam permintaan pull yang bocor, menunjukkan bahwa OpenAI juga menerapkan diferensiasi tersebut dalam model individual. Pengguna kemudian dapat memilih antara kueri yang lebih cepat dan hemat biaya serta analisis yang lebih mendalam dan intensif secara komputasi, tergantung pada kebutuhan mereka, sehingga memungkinkan pemanfaatan infrastruktur yang lebih efisien.

AI berbasis agen: Pergeseran paradigma nyata di balik angka-angka

Di balik angka-angka yang mengesankan untuk jendela konteks dan batasan token, terdapat pergeseran paradigma yang mungkin lebih penting bagi signifikansi ekonomi GPT-5.4 daripada spesifikasi teknis tunggal mana pun: evolusi menuju AI berbasis agen. Laporan tentang GPT-5.4 menjelaskan peningkatan yang menggerakkan model menuju "agen sejati" yang mampu secara mandiri melakukan tugas multi-tahap.

Lini pengembangan dalam seri GPT-5 menggambarkan perkembangan ini. GPT-5.2 unggul dalam tugas tunggal. GPT-5.3 Codex mengoptimalkan pemrograman otonom dan penggunaan terminal, kini memiliki 1,5 juta pengguna aktif mingguan. GPT-5.4 bertujuan untuk menawarkan kemampuan otonom yang lebih luas di seluruh tugas pemrograman, penelitian, dan visual. Peningkatan kemampuan memori di seluruh proses multi-tahap dan pengurangan tingkat kesalahan dalam tugas-tugas kompleks telah secara eksplisit disebutkan sebagai fitur-fiturnya.

Perkembangan ini memiliki implikasi signifikan bagi pasar perusahaan. Menurut analis Gartner, pada akhir tahun 2026, sekitar 70 persen perusahaan Fortune 500 dapat menggunakan arsitektur agen GPT 5.x untuk alur kerja inti, yang memberikan tekanan besar pada vendor perangkat lunak perusahaan tradisional. Lebih dari setengah dari semua perusahaan sudah menjajaki penggunaan agen AI, dengan aplikasi yang direncanakan termasuk tugas administratif, layanan pelanggan, dan pembuatan konten, tetapi hanya 12 persen yang telah melampaui fase eksperimental dan memasuki penerapan penuh.

Investasi perusahaan teknologi besar pada infrastruktur yang mendasarinya mencerminkan ekspektasi terhadap pasar ini. Microsoft berencana menginvestasikan modal sebesar $85 miliar, Google $70 miliar, Meta $65 miliar, dan Amazon $97 miliar, dengan total hampir $320 miliar hanya untuk infrastruktur komputasi. Jumlah ini tidak dihabiskan untuk chatbot yang lebih baik, melainkan untuk fondasi alur kerja otonom di mana agen AI akan mengambil alih tugas-tugas yang sebelumnya membutuhkan intervensi manusia.

Pertanyaan tentang kepercayaan: Keamanan dalam bayang-bayang rasisme

Frekuensi rilis yang dipercepat dan peningkatan kinerja model memunculkan pertanyaan yang melampaui dimensi teknis dan ekonomi: Bagaimana dengan keamanan? Demis Hassabis, CEO Google DeepMind, telah secara terbuka memperingatkan bahwa kondisi persaingan dan tekanan untuk mengungguli pesaing dapat menyebabkan keputusan yang terburu-buru dan berbahaya seiring industri semakin mendekati AI superhuman.

GPT-5.3 Instant menunjukkan gambaran yang beragam dalam hal ini. Model ini mencapai pengurangan tingkat halusinasi sebesar 26,8 persen untuk kueri berbasis web di bidang-bidang penting seperti kedokteran, hukum, dan keuangan, dan pengurangan sebesar 19,7 persen ketika hanya menggunakan basis pengetahuan internal. Pada saat yang sama, analisis independen menunjukkan bahwa model ini mengalami kemunduran di beberapa area keamanan dibandingkan dengan pendahulunya dengan memungkinkan lebih banyak konten yang berpotensi berbahaya untuk lolos. Pengurangan penolakan, yang disebut-sebut sebagai peningkatan dalam kegunaan, tampaknya telah menurunkan ambang batas di mana model tersebut memblokir kueri.

Untuk GPT-5.4 dengan mode Extreme Reasoning-nya, kekhawatiran keamanan ini bahkan lebih akut. Sebuah model yang mampu bekerja secara otonom pada masalah kompleks selama berjam-jam harus memiliki mekanisme yang kuat untuk mencegahnya menyimpang dari batasan yang telah ditentukan selama fase pemrosesan yang panjang ini. Pelonggaran pengamanan dalam persaingan untuk pangsa pasar bukanlah risiko abstrak, seperti yang diilustrasikan oleh laporan Axios baru-baru ini, yang menunjukkan bahwa perusahaan AI semakin melonggarkan protokol keamanan mereka untuk mendapatkan keunggulan kompetitif dalam inovasi.

Prospek: Normal baru berupa gangguan permanen

GPT-5.4 bukanlah produk yang terisolasi, melainkan gejala dari dinamika industri yang sedang menjelajahi wilayah yang belum dipetakan dalam beberapa hal. Rilis bulanan OpenAI dengan model-model yang semakin canggih, dikombinasikan dengan pembaruan yang hampir bersamaan dari Google dan Anthropic, menciptakan kondisi disrupsi konstan di mana keunggulan teknologi apa pun dapat diatasi dalam hitungan minggu.

Bagi perusahaan yang menggunakan teknologi AI, ini berarti pergeseran mendasar dalam prinsip perencanaan. Membangun aplikasi berdasarkan satu model atau vendor menjadi semakin berisiko. Arsitektur yang tidak bergantung pada model, yang memungkinkan peralihan tanpa hambatan antara OpenAI, Anthropic, dan Google, menjadi suatu keharusan. Siklus evaluasi, yang sebelumnya dilakukan setiap triwulan, harus dipersingkat menjadi bulanan atau bahkan dua mingguan.

Pada saat yang sama, logika evaluasi untuk model AI sedang bergeser. Pertanyaannya bukan lagi model mana yang mencapai skor benchmark tertinggi, melainkan model mana yang memberikan hasil paling andal dengan biaya terendah dalam kasus penggunaan tertentu. GPT-5.4, dengan mode Extreme Reasoning-nya, mungkin merupakan pilihan terbaik untuk penelitian ilmiah mutakhir, sementara untuk aplikasi bisnis sehari-hari, GPT-5.3 Instant yang lebih cepat dan hemat biaya tetap menjadi pilihan yang lebih pragmatis.

Pasar prediksi, yang memberikan GPT-5.4 probabilitas 55 persen untuk dirilis sebelum April dan 74 persen sebelum Juni, menunjukkan bahwa penantiannya akan singkat. Beberapa pengamat bahkan berspekulasi tanggal rilis 4 Mei, mengikuti format tanggal Amerika yaitu 5/4, yang sesuai dengan kecenderungan OpenAI untuk referensi budaya semacam itu. Satu hal yang pasti: GPT-5.4 bukanlah spekulasi. Ini adalah kode yang dirujuk dalam produksi. Pertanyaannya bukan apakah, tetapi kapan dan sejauh mana ia akan memenuhi janji yang disarankan oleh kode yang bocor.

Yang tersisa adalah industri yang bertransformasi dengan kecepatan yang belum pernah terjadi sebelumnya, didorong oleh perlombaan untuk supremasi teknologi yang menghabiskan ratusan miliar dolar setiap tahunnya dan yang kelayakan ekonominya belum terbukti. GPT-5.4 adalah babak selanjutnya dalam kisah ini, tetapi tentu bukan yang terakhir.

Mitra pemasaran dan pengembangan bisnis global Anda

☑️ Bahasa bisnis kami adalah bahasa Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa ibu Anda!

Konrad Wolfenstein

Saya dan tim saya dengan senang hati siap membantu Anda sebagai penasihat pribadi Anda.

Anda dapat menghubungi saya dengan mengisi formulir kontak di sini wolfenstein@xpert.digital:atau cukup hubungi saya di +49 7348 4088 965. Alamat email saya adalah

Saya sangat menantikan proyek bersama kita.

☑️ Dukungan UKM dalam strategi, konsultasi, perencanaan, dan implementasi

☑️ Pembuatan atau penyesuaian kembali strategi digital dan digitalisasi

☑️ Perluasan dan optimalisasi proses penjualan internasional

☑️ Platform perdagangan B2B global & digital

☑️ Pelopor Pengembangan Bisnis / Pemasaran / Humas / Pameran Dagang

🎯🎯🎯 Manfaatkan keahlian Xpert.Digital yang luas dan mencakup lima bidang dalam satu paket layanan komprehensif | Pengembangan Bisnis, Penelitian & Pengembangan, XR, Humas & Optimalisasi Visibilitas Digital

Manfaatkan keahlian Xpert.Digital yang luas dan mencakup lima bidang dalam paket layanan komprehensif | Litbang, XR, PR & Optimalisasi Visibilitas Digital - Gambar: Xpert.Digital

Xpert.Digital memiliki pengetahuan mendalam di berbagai industri. Hal ini memungkinkan kami untuk mengembangkan strategi yang disesuaikan secara tepat dan selaras dengan kebutuhan serta tantangan segmen pasar spesifik Anda. Dengan terus menganalisis tren pasar dan memantau perkembangan industri, kami dapat bertindak proaktif dan menawarkan solusi inovatif. Kombinasi pengalaman dan keahlian menghasilkan nilai tambah dan memberikan keunggulan kompetitif yang menentukan bagi klien kami.

Informasi selengkapnya di sini:

Dapatkan manfaat dari 5 bidang keahlian Xpert.Digital dalam satu paket – mulai dari hanya €500/bulan

Lompatan kuantum untuk OpenAI? Raksasa AI tersembunyi: Bagaimana OpenAI bertujuan mengungguli Google dan Anthropic dengan GPT-5.4

Bocoran tak sengaja: Mega-model baru OpenAI, GPT-5.4, akan segera dirilis

GPT-5.4: Lompatan kuantum OpenAI berikutnya antara Penalaran Ekstrem dan pertempuran untuk supremasi AI

Anatomi sebuah wahyu yang tidak disengaja

Janji dua juta token dan keterbatasannya

Penalaran Ekstrem: Ketika AI membutuhkan lebih banyak waktu untuk berpikir

Analisis gambar setingkat piksel: Akhir dari kompromi

Menentukan kecepatan perlombaan: Frekuensi rilis yang dipercepat dari OpenAI

Dimensi baru transformasi digital dengan 'Managed AI' (Kecerdasan Buatan) - Platform & solusi B2B | Xpert Consulting

Persaingan AI semakin memanas: Bagaimana GPT-5.4 berupaya mengungguli Google dan Anthropic

Lanskap persaingan: Tiga perusahaan, satu perlombaan, tanpa pemenang yang jelas

Pentagon, protes, dan krisis kepercayaan

Persamaan ekonomi: Antara pendapatan rekor dan kerugian rekor

Apa arti GPT-5.4 bagi ekonomi infrastruktur?

AI berbasis agen: Pergeseran paradigma nyata di balik angka-angka

Pertanyaan tentang kepercayaan: Keamanan dalam bayang-bayang rasisme

Prospek: Normal baru berupa gangguan permanen

Mitra pemasaran dan pengembangan bisnis global Anda

☑️ Bahasa bisnis kami adalah bahasa Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa ibu Anda!

☑️ Dukungan UKM dalam strategi, konsultasi, perencanaan, dan implementasi

☑️ Pembuatan atau penyesuaian kembali strategi digital dan digitalisasi

☑️ Perluasan dan optimalisasi proses penjualan internasional

☑️ Platform perdagangan B2B global & digital

☑️ Pelopor Pengembangan Bisnis / Pemasaran / Humas / Pameran Dagang

🎯🎯🎯 Manfaatkan keahlian Xpert.Digital yang luas dan mencakup lima bidang dalam satu paket layanan komprehensif | Pengembangan Bisnis, Penelitian & Pengembangan, XR, Humas & Optimalisasi Visibilitas Digital

Topik lainnya