AMI – Kecerdasan Mesin Tingkat Lanjut – Akhir dari Skalabilitas: Mengapa Yann LeCun Tidak Lagi Percaya pada LLM
Xpert pra-rilis
Pemilihan suara 📢
Diterbitkan pada: 23 November 2025 / Diperbarui pada: 23 November 2025 – Penulis: Konrad Wolfenstein

AMI – Kecerdasan Mesin Tingkat Lanjut – Akhir dari Skalabilitas: Mengapa Yann LeCun Tidak Lagi Percaya pada LLM – Gambar: Xpert.Digital
Jalan buntu alih-alih kecerdasan super: Mengapa kepala visioner Meta sekarang mengundurkan diri
600 miliar untuk pendekatan yang salah arah? "Bapak AI" bertaruh melawan LLaMA, ChatGPT, & rekan-rekannya.
Pengumuman ini menggemparkan industri teknologi pada November 2025. Yann LeCun, salah satu dari tiga pendiri pembelajaran mendalam dan kepala ilmuwan di Meta, mengumumkan kepergiannya setelah dua belas tahun bersama perusahaan untuk mendirikan perusahaan rintisannya sendiri. Keputusan ini lebih dari sekadar pilihan karier pribadi seorang ilmuwan. Keputusan ini menandai titik balik fundamental dalam industri kecerdasan buatan global dan menunjukkan kesenjangan yang semakin lebar antara kepentingan pasar jangka pendek dan visi ilmiah jangka panjang.
LeCun, yang menerima Penghargaan Turing pada tahun 2018 bersama Geoffrey Hinton dan Yoshua Bengio, dianggap sebagai arsitek jaringan saraf konvolusional, yang kini menjadi fondasi sistem pemrosesan gambar modern. Kepergiannya terjadi di saat seluruh industri menginvestasikan ratusan miliar dolar dalam model bahasa berskala besar, sebuah teknologi yang selama bertahun-tahun digambarkan LeCun sebagai jalan buntu yang fundamental. Dengan perusahaan barunya, ilmuwan yang kini berusia 65 tahun ini bermaksud untuk mengembangkan apa yang ia sebut Kecerdasan Mesin Tingkat Lanjut, sebuah pendekatan yang sangat berbeda berdasarkan model dunia dan dimulai dengan persepsi fisik, bukan teks.
Implikasi ekonomi dari perkembangan ini sangat besar. Meta sendiri telah menginvestasikan lebih dari $600 miliar dalam infrastruktur AI dalam tiga tahun terakhir. OpenAI telah mencapai valuasi setengah triliun dolar, meskipun pendapatan tahunannya hanya sepuluh miliar dolar. Seluruh industri telah bergerak ke arah yang kini digambarkan secara publik oleh salah satu pelopor terpentingnya sebagai jalan buntu. Untuk memahami konsekuensi ekonomi dari pergeseran ini, kita harus mendalami struktur teknis, organisasi, dan keuangan dari revolusi AI saat ini.
Cocok untuk:
Arsitektur gelembung
Arsitektur Transformer, yang diperkenalkan oleh para peneliti di Google pada tahun 2017, telah mengubah lanskap AI dengan kecepatan yang belum pernah terjadi sebelumnya. Pendekatan ini memungkinkan untuk pertama kalinya memproses teks dalam jumlah besar secara efisien dan melatih model bahasa dengan kemampuan yang sebelumnya tidak dapat dicapai. OpenAI membangun fondasi ini dengan seri GPT-nya, yang, dengan ChatGPT pada November 2022, mendemonstrasikan kepada khalayak luas untuk pertama kalinya apa yang dapat dicapai oleh teknologi ini. Responsnya sangat luar biasa. Dalam beberapa bulan, puluhan miliar dolar mengalir ke sektor ini.
Namun, sejak akhir tahun 2024, semakin banyak tanda yang menunjukkan bahwa perkembangan eksponensial ini mencapai batasnya. OpenAI telah mengembangkan penerus GPT-4, yang secara internal disebut Orion atau GPT-5, selama lebih dari 18 bulan. Perusahaan dilaporkan telah melakukan setidaknya dua pelatihan besar, yang masing-masing menghabiskan biaya sekitar $500 juta. Hasilnya sungguh menyadarkan. Meskipun GPT-4 menunjukkan peningkatan performa yang sangat besar dibandingkan GPT-3, peningkatan Orion dibandingkan GPT-4 masih marjinal. Di beberapa area, terutama pemrograman, model ini hampir tidak menunjukkan kemajuan.
Perkembangan ini pada dasarnya bertentangan dengan hukum penskalaan, prinsip-prinsip empiris yang hingga saat ini memandu seluruh industri. Ide dasarnya sederhana: jika Anda memperbesar model, menggunakan lebih banyak data untuk pelatihan, dan menginvestasikan lebih banyak daya komputasi, peningkatan kinerja akan mengikuti fungsi daya yang dapat diprediksi. Prinsip ini tampaknya berlaku secara universal dan membenarkan investasi astronomis dalam beberapa tahun terakhir. Sekarang ternyata kurva-kurva ini mendatar. Penggandaan investasi berikutnya tidak lagi menghasilkan penggandaan kinerja seperti yang diharapkan.
Alasannya beragam dan rumit secara teknis. Masalah utamanya adalah dinding data. GPT-4 dilatih dengan sekitar 13 triliun token, yang pada dasarnya setara dengan seluruh internet yang tersedia untuk umum. Untuk GPT-5, data baru berkualitas tinggi tidak mencukupi. OpenAI telah merespons dengan merekrut pengembang perangkat lunak, matematikawan, dan fisikawan teoretis untuk menghasilkan data baru dengan menulis kode dan memecahkan masalah matematika. Namun, bahkan jika 1.000 orang menghasilkan 5.000 kata per hari, dibutuhkan waktu berbulan-bulan untuk menghasilkan satu miliar token saja. Skalabilitas menggunakan data buatan manusia jelas tidak akan berhasil.
Sebagai alternatif, perusahaan semakin bergantung pada data sintetis—yaitu, data yang dihasilkan oleh model AI lain. Namun, di sinilah bahaya baru mengintai: keruntuhan model. Ketika model dilatih secara rekursif berdasarkan data yang dihasilkan oleh model lain, kesalahan kecil akan semakin besar dari generasi ke generasi. Hasilnya adalah model yang semakin terpisah dari kenyataan, dan di mana kelompok minoritas dalam data menghilang secara tidak proporsional. Sebuah studi yang diterbitkan di Nature pada tahun 2024 menunjukkan bahwa proses ini terjadi dengan sangat cepat. Oleh karena itu, data sintetis bukanlah obat mujarab, melainkan mengandung risiko yang signifikan.
Transisi energi dan batasan pertumbuhan
Selain hambatan data, ada hambatan kedua yang bahkan lebih mendasar: hambatan energi. Pelatihan GPT-3 menghabiskan sekitar 1.300 megawatt-jam listrik, setara dengan konsumsi tahunan 130 rumah tangga di Amerika. GPT-4 diperkirakan membutuhkan 50 kali lipat jumlah tersebut, atau 65.000 megawatt-jam. Daya komputasi yang dibutuhkan untuk melatih model AI besar berlipat ganda kira-kira setiap 100 hari. Kurva eksponensial ini dengan cepat menyebabkan keterbatasan fisik.
Pusat data yang melatih dan mengoperasikan model-model ini sudah mengonsumsi listrik sebanyak kota-kota kecil. Badan Energi Internasional (IEA) memperkirakan konsumsi listrik pusat data akan meningkat sebesar 80 persen pada tahun 2026, dari 20 terawatt-jam pada tahun 2022 menjadi 36 terawatt-jam pada tahun 2026. AI adalah pendorong utama pertumbuhan ini. Sebagai perbandingan, satu kueri ChatGPT mengonsumsi energi sekitar sepuluh kali lebih banyak daripada pencarian Google. Dengan miliaran kueri per hari, jumlah ini sangat besar.
Perkembangan ini memaksa perusahaan teknologi untuk mengambil langkah drastis. Microsoft telah menandatangani kontrak dengan penyedia energi nuklir. Meta, Amazon, dan Google menginvestasikan total lebih dari $1,3 triliun dalam beberapa tahun mendatang untuk membangun infrastruktur yang diperlukan. Namun, investasi ini menghadapi batasan fisik dan politik. AS tidak memiliki infrastruktur energi yang cukup untuk mendukung pusat data AI yang direncanakan. Analis memperkirakan bahwa proyek senilai $750 miliar dapat tertunda hingga tahun 2030 karena kemacetan infrastruktur energi.
Ditambah lagi dengan dimensi geopolitik. Permintaan energi industri AI mengintensifkan persaingan sumber daya dan meningkatkan ketergantungan pada bahan bakar fosil. Sementara para pembuat kebijakan menuntut netralitas iklim, industri AI justru meningkatkan konsumsi energi. Ketegangan ini akan semakin memburuk di tahun-tahun mendatang dan dapat menyebabkan intervensi regulasi yang membatasi pertumbuhan industri.
Dinding arsitektur dan alternatif LeCun
Hambatan ketiga mungkin yang paling mendasar: tembok arsitektur. Yann LeCun telah berargumen selama bertahun-tahun bahwa arsitektur Transformer memiliki keterbatasan inheren yang tidak dapat diatasi hanya dengan penskalaan. Kritiknya berfokus pada cara kerja fundamental Model Bahasa Besar. Sistem ini dilatih untuk memprediksi kata berikutnya dalam suatu urutan. Sistem ini mempelajari pola statistik dalam korpus teks masif, tetapi tidak mengembangkan pemahaman yang benar tentang kausalitas, hukum fisika, atau perencanaan jangka panjang.
LeCun suka mengilustrasikan masalah ini dengan sebuah perbandingan: Seorang anak berusia empat tahun telah menyerap lebih banyak informasi tentang dunia melalui persepsi visual dibandingkan model bahasa terhebat melalui teks. Seorang anak secara intuitif memahami bahwa benda tidak menghilang begitu saja, bahwa benda berat jatuh, dan bahwa tindakan memiliki konsekuensi. Mereka telah mengembangkan model dunia, sebuah representasi internal dari realitas fisik, yang mereka gunakan untuk membuat prediksi dan merencanakan tindakan. LLM tidak memiliki kemampuan mendasar ini. Mereka dapat menghasilkan teks yang sangat koheren, tetapi mereka tidak memahami dunia.
Keterbatasan ini semakin nyata dalam aplikasi praktis. Jika Anda meminta GPT-4 untuk memvisualisasikan kubus yang berputar, ia gagal dalam tugas yang dapat diselesaikan dengan mudah oleh anak mana pun. Dengan tugas-tugas kompleks yang memerlukan perencanaan multi-langkah, model-model tersebut seringkali gagal. Model-model tersebut tidak dapat belajar secara andal dari kesalahan karena setiap kesalahan prediksi token berpotensi berjenjang dan berlipat ganda. Model autoregresif memiliki kelemahan mendasar: kesalahan di awal urutan dapat merusak keseluruhan hasil.
Alternatif LeCun adalah model dunia berdasarkan Arsitektur Prediktif Penanaman Bersama (Joint Embedding Predictive Architecture). Ide dasarnya adalah bahwa sistem AI seharusnya tidak belajar melalui prediksi teks, melainkan dengan memprediksi representasi abstrak dari keadaan masa depan. Alih-alih menghasilkan piksel demi piksel atau token demi token, sistem mempelajari representasi dunia yang terkompresi dan terstruktur, dan dapat menggunakannya untuk mensimulasikan berbagai skenario secara mental sebelum bertindak.
Di bawah kepemimpinan LeCun, Meta telah mengembangkan beberapa implementasi pendekatan ini. I-JEPA untuk gambar dan V-JEPA untuk video menunjukkan hasil yang menjanjikan. Model-model ini mempelajari komponen objek tingkat tinggi dan hubungan spasialnya tanpa bergantung pada akuisisi data intensif. Model-model ini juga jauh lebih hemat energi untuk dilatih dibandingkan model konvensional. Visinya adalah menggabungkan pendekatan-pendekatan ini ke dalam sistem hierarkis yang dapat beroperasi pada berbagai tingkat abstraksi dan skala waktu.
Perbedaan krusialnya terletak pada sifat proses pembelajaran. Sementara LLM pada dasarnya melakukan pencocokan pola secara berlebihan, model dunia bertujuan untuk memahami struktur dan kausalitas realitas. Sistem dengan model dunia yang robust dapat mengantisipasi konsekuensi dari tindakannya tanpa harus benar-benar melakukannya. Sistem tersebut dapat belajar dari beberapa contoh karena memahami prinsip-prinsip yang mendasarinya, bukan sekadar korelasi yang dangkal.
Disfungsi organisasi dan krisis eksistensial Meta
Namun, kepergian LeCun bukan semata-mata keputusan ilmiah, melainkan akibat disfungsi organisasi di Meta. Pada Juni 2025, CEO Mark Zuckerberg mengumumkan restrukturisasi besar-besaran divisi AI. Ia mendirikan Meta Superintelligence Labs, sebuah unit baru dengan tujuan mengembangkan Kecerdasan Umum Buatan. Unit ini dipimpin oleh Alexandr Wang, mantan CEO Scale AI yang berusia 28 tahun, sebuah perusahaan persiapan data. Meta menginvestasikan $14,3 miliar di Scale AI dan merekrut lebih dari 50 insinyur dan peneliti dari para pesaing.
Keputusan ini menjungkirbalikkan struktur yang ada. Tim Riset AI Fundamental LeCun, yang telah bertahun-tahun mengembangkan PyTorch dan model Llama pertama, terpinggirkan. FAIR diarahkan pada riset fundamental dengan jangka waktu lima hingga sepuluh tahun, sementara laboratorium superintelijen yang baru berfokus pada pengembangan produk jangka pendek. Sumber-sumber melaporkan meningkatnya kekacauan di departemen AI Meta. Talenta-talenta top yang baru direkrut mengungkapkan rasa frustrasi terhadap birokrasi perusahaan besar, sementara tim-tim yang sudah mapan merasakan pengaruh mereka semakin memudar.
Situasi memburuk akibat beberapa restrukturisasi hanya dalam enam bulan. Pada Agustus 2025, Superintelligence Labs direorganisasi lagi, kali ini menjadi empat subunit: Lab TBD yang misterius untuk model-model baru, tim produk, tim infrastruktur, dan FAIR. Gelombang PHK kembali terjadi pada bulan Oktober, dengan sekitar 600 karyawan menerima pesangon. Alasan yang disebutkan: mengurangi kompleksitas organisasi dan mempercepat pengembangan AI.
Restrukturisasi yang terus-menerus ini sangat kontras dengan stabilitas relatif para pesaing seperti OpenAI, Google, dan Anthropic. Hal ini menunjukkan ketidakpastian mendasar di Meta mengenai arah strategis yang tepat. Zuckerberg telah menyadari bahwa Meta tertinggal dalam persaingan untuk mendominasi AI. Llama 4, yang diluncurkan pada April 2025, mengecewakan. Meskipun model Maverick menunjukkan efisiensi yang baik, model tersebut gagal secara dramatis dalam konteks yang lebih panjang. Muncul dugaan bahwa Meta mengoptimalkan benchmark dengan melatih model secara khusus pada pertanyaan pengujian umum, sehingga meningkatkan kinerja secara artifisial.
Bagi LeCun, situasi ini menjadi tak tertahankan. Visinya tentang riset fundamental jangka panjang berbenturan dengan tekanan untuk menghasilkan kesuksesan produk jangka pendek. Fakta bahwa ia secara efektif berada di bawah Wang yang jauh lebih muda kemungkinan turut memengaruhi keputusannya. Dalam memo perpisahannya, LeCun menekankan bahwa Meta akan tetap menjadi mitra di perusahaan barunya, tetapi pesannya jelas: riset independen yang ia anggap penting tidak lagi dimungkinkan dalam struktur perusahaan.
Dimensi baru transformasi digital dengan 'Managed AI' (Kecerdasan Buatan) - Platform & Solusi B2B | Xpert Consulting

Dimensi baru transformasi digital dengan 'Managed AI' (Kecerdasan Buatan) – Platform & Solusi B2B | Xpert Consulting - Gambar: Xpert.Digital
Di sini Anda akan mempelajari bagaimana perusahaan Anda dapat menerapkan solusi AI yang disesuaikan dengan cepat, aman, dan tanpa hambatan masuk yang tinggi.
Platform AI Terkelola adalah paket lengkap dan bebas repot untuk kecerdasan buatan. Alih-alih berurusan dengan teknologi yang rumit, infrastruktur yang mahal, dan proses pengembangan yang panjang, Anda akan mendapatkan solusi siap pakai yang disesuaikan dengan kebutuhan Anda dari mitra spesialis – seringkali dalam beberapa hari.
Manfaat utama sekilas:
⚡ Implementasi cepat: Dari ide hingga aplikasi operasional dalam hitungan hari, bukan bulan. Kami memberikan solusi praktis yang menciptakan nilai langsung.
Keamanan data maksimal: Data sensitif Anda tetap menjadi milik Anda. Kami menjamin pemrosesan yang aman dan sesuai aturan tanpa membagikan data dengan pihak ketiga.
💸 Tanpa risiko finansial: Anda hanya membayar untuk hasil. Investasi awal yang tinggi untuk perangkat keras, perangkat lunak, atau personel sepenuhnya dihilangkan.
🎯 Fokus pada bisnis inti Anda: Fokuslah pada keahlian Anda. Kami menangani seluruh implementasi teknis, operasional, dan pemeliharaan solusi AI Anda.
📈 Tahan Masa Depan & Skalabel: AI Anda tumbuh bersama Anda. Kami memastikan pengoptimalan dan skalabilitas berkelanjutan, serta menyesuaikan model secara fleksibel dengan kebutuhan baru.
Lebih lanjut tentang itu di sini:
Dari sensasi menjadi kenyataan: Penilaian ulang industri AI yang akan datang
Anatomi ekonomi pembentukan lepuh
Perkembangan di Meta merupakan gejala dinamika ekonomi yang lebih luas dalam industri AI. Sejak terobosan ChatGPT di akhir tahun 2022, lonjakan investasi yang belum pernah terjadi sebelumnya telah terjadi. Pada kuartal pertama tahun 2025 saja, $73,1 miliar mengalir ke perusahaan rintisan AI, mewakili 58 persen dari seluruh investasi modal ventura. OpenAI mencapai valuasi $500 miliar, menjadikannya perusahaan swasta pertama yang mencapai ambang batas ini tanpa pernah menghasilkan laba.
Valuasinya sangat tidak proporsional dengan pendapatan aktual. OpenAI menghasilkan pendapatan tahunan sebesar $10 miliar pada tahun 2025 dengan valuasi $500 miliar, menghasilkan rasio harga terhadap penjualan sebesar 50. Sebagai perbandingan, bahkan di puncak gelembung dot-com, hanya sedikit perusahaan yang mencapai kelipatan tersebut. Anthropic dinilai sebesar $170 miliar dengan pendapatan $2,2 miliar, dengan rasio P/E sekitar 77. Angka-angka ini menunjukkan valuasi yang sangat tinggi.
Struktur pembiayaan sirkular yang telah berkembang menjadi salah satu masalah utama. Nvidia menginvestasikan $100 miliar di OpenAI, yang pada gilirannya berkewajiban membeli chip Nvidia senilai puluhan miliar dolar. OpenAI juga telah membuat kesepakatan serupa dengan AMD senilai puluhan miliar dolar. Microsoft telah berinvestasi lebih dari $13 miliar di OpenAI dan menghosting infrastrukturnya di Azure. Amazon menginvestasikan $8 miliar di Anthropic, yang kemudian menggunakan AWS sebagai platform cloud utamanya dan menggunakan chip AI milik Amazon sendiri.
Pengaturan ini mengingatkan kita pada pembiayaan sirkular di akhir tahun 1990-an, ketika perusahaan teknologi saling menjual peralatan dan mencatat transaksi tersebut sebagai pendapatan tanpa menghasilkan nilai ekonomi riil. Para analis berbicara tentang jaringan hubungan bisnis yang semakin kompleks dan tidak transparan yang memicu ledakan triliunan dolar. Persamaan antara gelembung dot-com dan krisis keuangan 2008 sangat jelas: mekanisme pembiayaan yang tidak transparan dan tidak konvensional yang sulit dipahami dan dinilai oleh investor.
Ditambah lagi dengan konsentrasi modal. The Magnificent Seven, tujuh perusahaan teknologi terbesar di AS, meningkatkan konsumsi energi mereka sebesar 19 persen pada tahun 2023, sementara konsumsi median perusahaan-perusahaan S&P 500 stagnan. Sekitar 80 persen keuntungan pasar saham di AS pada tahun 2025 berasal dari perusahaan-perusahaan yang bergerak di bidang AI. Nvidia sendiri menjadi saham yang paling banyak dibeli oleh investor ritel, yang menginvestasikan hampir $30 miliar pada produsen chip tersebut pada tahun 2024.
Konsentrasi ekstrem ini membawa risiko sistemik. Jika ekspektasi imbal hasil terbukti tidak realistis, kejatuhan pasar dapat berdampak luas. JPMorgan memperkirakan bahwa penerbitan obligasi berperingkat investasi terkait AI saja dapat mencapai $1,5 triliun pada tahun 2030. Sebagian besar utang ini didasarkan pada asumsi bahwa sistem AI akan menghasilkan peningkatan produktivitas yang sangat besar. Jika ekspektasi ini gagal terwujud, krisis kredit akan mengancam.
Cocok untuk:
- Meta mempertaruhkan segalanya pada kecerdasan super: investasi miliaran dolar, pusat data besar, dan perlombaan AI yang berisiko
Perang bakat dan pergolakan sosial
Ketegangan ekonomi juga terasa di pasar tenaga kerja. Rasio lowongan AI dengan kandidat yang memenuhi syarat adalah 3,2 banding 1. Terdapat 1,6 juta lowongan, tetapi hanya 518.000 pelamar yang memenuhi syarat. Kekurangan tenaga kerja yang ekstrem ini mendorong gaji ke tingkat yang sangat tinggi. Spesialis AI dapat menambah penghasilan tahunan mereka hingga puluhan ribu dolar dengan menguasai keterampilan dalam Python, TensorFlow, atau kerangka kerja AI khusus.
Persaingannya sangat ketat. Perusahaan teknologi besar, startup dengan pendanaan yang baik, dan bahkan pemerintah bersaing untuk mendapatkan sekelompok kecil pakar yang sama. OpenAI telah mengalami eksodus eksekutif dalam beberapa bulan terakhir, termasuk salah satu pendiri Ilya Sutskever dan Chief Technology Officer Mira Murati. Banyak dari individu berbakat ini meluncurkan startup mereka sendiri atau pindah ke perusahaan kompetitor. Meta sedang gencar merekrut dari OpenAI, Anthropic, dan Google. Anthropic merekrut dari Meta dan OpenAI.
Dinamika ini memiliki beberapa konsekuensi. Pertama, hal ini memecah lanskap penelitian. Alih-alih bekerja menuju tujuan bersama, tim-tim kecil di berbagai organisasi justru bersaing untuk mencapai terobosan yang sama. Kedua, hal ini meningkatkan biaya. Gaji yang sangat besar untuk spesialis AI hanya dapat dipertahankan oleh perusahaan-perusahaan bermodal besar, yang berarti menyingkirkan pemain-pemain kecil dari pasar. Ketiga, hal ini menunda proyek. Perusahaan-perusahaan melaporkan bahwa lowongan pekerjaan tetap kosong selama berbulan-bulan, sehingga mengganggu jadwal pengembangan.
Implikasi sosialnya jauh melampaui sektor teknologi. Jika AI benar-benar mewakili revolusi industri berikutnya, maka pergolakan besar di pasar tenaga kerja sudah di depan mata. Tidak seperti revolusi industri pertama, yang utamanya memengaruhi tenaga kerja fisik, AI menargetkan tugas-tugas kognitif. Tidak hanya entri data sederhana dan layanan pelanggan yang terancam, tetapi juga profesi-profesi berkeahlian tinggi seperti programmer, desainer, pengacara, dan jurnalis.
Sebuah studi tentang industri manajemen investasi memprediksi penurunan lima persen dalam pangsa pendapatan berbasis tenaga kerja akibat AI dan big data. Hal ini sebanding dengan pergeseran selama revolusi industri, yang menyebabkan penurunan lima hingga 15 persen. Perbedaan krusialnya: transformasi saat ini berlangsung selama bertahun-tahun, bukan puluhan tahun. Masyarakat hanya punya sedikit waktu untuk beradaptasi.
Komputasi Waktu Uji dan Pergeseran Paradigma
Meskipun hukum penskalaan untuk pra-pelatihan telah mencapai batasnya, sebuah paradigma baru telah muncul: penskalaan komputasi waktu pengujian. Model o1 OpenAI menunjukkan bahwa peningkatan performa yang signifikan dimungkinkan dengan menginvestasikan lebih banyak daya komputasi selama inferensi. Alih-alih hanya meningkatkan ukuran model, sistem ini memungkinkan model untuk memikirkan kueri lebih lama, menggunakan berbagai pendekatan untuk menyelesaikannya, dan memverifikasi sendiri jawabannya.
Namun, penelitian menunjukkan bahwa paradigma ini juga memiliki keterbatasan. Penskalaan sekuensial, di mana suatu model mengulangi masalah yang sama beberapa kali, tidak menghasilkan perbaikan berkelanjutan. Studi pada model seperti Deepseeks R1 dan QwQ menunjukkan bahwa proses berpikir yang lebih lama tidak serta merta menghasilkan hasil yang lebih baik. Seringkali, model mengoreksi jawaban yang benar untuk jawaban yang salah, alih-alih sebaliknya. Kapasitas revisi diri yang diperlukan untuk penskalaan sekuensial yang efektif belum dikembangkan secara memadai.
Penskalaan paralel, di mana beberapa solusi dihasilkan secara bersamaan dan solusi terbaik dipilih, menunjukkan hasil yang lebih baik. Namun, di sini pun, manfaat marjinal berkurang seiring dengan penggandaan daya komputasi yang diinvestasikan. Efisiensi biaya menurun drastis. Untuk aplikasi komersial yang perlu menjawab jutaan pertanyaan per hari, biayanya sangat mahal.
Terobosan sesungguhnya dapat dicapai dengan menggabungkan berbagai pendekatan. Arsitektur hibrida yang menggabungkan Transformer dengan Model Ruang Keadaan menjanjikan penyatuan kekuatan keduanya. Model Ruang Keadaan seperti Mamba menawarkan perilaku penskalaan linear dalam inferensi, sementara Transformer unggul dalam menangkap dependensi jangka panjang. Sistem hibrida semacam itu dapat menyeimbangkan kembali persamaan biaya-kualitas.
Arsitektur alternatif dan masa depan setelah Transformers
Selain model dunia, sejumlah arsitektur alternatif bermunculan yang dapat menantang dominasi Transformer. Model ruang-keadaan telah mencapai kemajuan signifikan dalam beberapa tahun terakhir. S4, Mamba, dan Hyena menunjukkan bahwa penalaran konteks panjang yang efisien dengan kompleksitas linear dimungkinkan. Sementara Transformer berskala secara kuadratik terhadap panjang sekuens, SSM mencapai penskalaan linear baik dalam pelatihan maupun inferensi.
Peningkatan efisiensi ini dapat menjadi krusial ketika sistem AI diterapkan di lingkungan produksi. Biaya inferensi seringkali diremehkan. Pelatihan merupakan investasi satu kali, tetapi inferensi berjalan terus-menerus. ChatGPT tidak pernah offline. Dengan miliaran kueri harian, peningkatan efisiensi sekecil apa pun dapat menghasilkan penghematan biaya yang sangat besar. Model yang membutuhkan setengah daya komputasi untuk kualitas yang sama memiliki keunggulan kompetitif yang luar biasa.
Tantangannya terletak pada pematangan teknologi-teknologi ini. Transformer memiliki keunggulan hampir delapan tahun dan ekosistem perangkat, pustaka, dan keahlian yang luas. Arsitektur alternatif tidak hanya harus unggul secara teknis tetapi juga dapat digunakan secara praktis. Sejarah teknologi penuh dengan solusi-solusi unggul secara teknis yang gagal di pasar karena kurangnya ekosistem.
Menariknya, pesaing Tiongkok juga mengandalkan pendekatan alternatif. DeepSeek V3, sebuah model sumber terbuka dengan 671 miliar parameter, menggunakan arsitektur gabungan para pakar di mana hanya 37 miliar parameter yang diaktifkan per token. Model ini mencapai kinerja yang sebanding dengan pesaing Barat dalam uji tolok ukur, tetapi dilatih dengan biaya yang jauh lebih rendah. Waktu pelatihannya hanya 2,788 juta jam GPU H800, jauh lebih sedikit daripada model yang sebanding.
Perkembangan ini menunjukkan bahwa kepemimpinan teknologi tidak selalu berada di tangan pemain yang paling kuat secara finansial. Keputusan arsitektur dan optimasi yang cerdas dapat mengimbangi keunggulan sumber daya. Bagi lanskap AI global, ini berarti peningkatan multipolaritas. Tiongkok, Eropa, dan kawasan lain sedang mengembangkan pendekatan mereka sendiri yang tidak sekadar meniru model Barat.
Penilaian ulang dan mabuk yang tak terelakkan
Konvergensi semua faktor ini menunjukkan adanya penilaian ulang yang akan segera dilakukan terhadap industri AI. Valuasi saat ini didasarkan pada asumsi pertumbuhan eksponensial yang berkelanjutan, baik dalam kinerja model maupun adopsi komersial. Kedua asumsi ini semakin dipertanyakan. Kinerja model stagnan, sementara biaya terus meroket. Meskipun adopsi komersial meningkat, monetisasi tetap menjadi tantangan.
OpenAI, dengan valuasinya yang mencapai setengah triliun dolar, perlu tumbuh hingga pendapatan tahunan setidaknya $100 miliar dan mencapai profitabilitas di tahun-tahun mendatang untuk membenarkan valuasinya. Artinya, peningkatan sepuluh kali lipat hanya dalam beberapa tahun. Sebagai perbandingan, Google membutuhkan waktu lebih dari satu dekade untuk tumbuh dari $10 miliar menjadi $100 miliar dalam pendapatan. Ekspektasi terhadap perusahaan AI terlalu tinggi dan tidak realistis.
Para analis memperingatkan potensi pecahnya gelembung AI. Persamaannya dengan gelembung dot-com sangat jelas. Dulu, seperti sekarang, terdapat teknologi revolusioner dengan potensi yang sangat besar. Dulu, seperti sekarang, terdapat valuasi yang digelembungkan secara tidak rasional dan struktur pembiayaan sirkular. Dulu, seperti sekarang, investor membenarkan valuasi yang absurd dengan berargumen bahwa teknologi akan mengubah segalanya dan metrik valuasi tradisional tidak lagi berlaku.
Perbedaan krusialnya: Tidak seperti banyak perusahaan dot-com, perusahaan AI masa kini benar-benar memiliki produk yang berfungsi dan bernilai nyata. ChatGPT bukanlah perangkat lunak yang mudah menguap, melainkan teknologi yang digunakan jutaan orang setiap hari. Pertanyaannya bukanlah apakah AI itu bernilai, melainkan apakah nilainya cukup untuk membenarkan valuasinya saat ini. Jawabannya kemungkinan besar tidak.
Ketika revaluasi tiba, dampaknya akan sangat menyakitkan. Dana modal ventura telah menginvestasikan 70 persen modal mereka di AI. Dana pensiun dan investor institusional sangat terekspos. Penurunan valuasi AI yang signifikan akan berdampak finansial yang luas. Perusahaan yang mengandalkan pembiayaan murah akan tiba-tiba kesulitan mengumpulkan modal. Proyek akan terhenti, dan staf akan diberhentikan.
Perspektif jangka panjang dan jalan ke depan
Meskipun prospek jangka pendeknya suram, potensi jangka panjang kecerdasan buatan tetap besar. Gegap gempita saat ini tidak mengubah pentingnya teknologi ini. Pertanyaannya bukanlah apakah, melainkan bagaimana dan kapan AI akan memenuhi janjinya. Pergeseran LeCun dari pengembangan produk jangka pendek ke penelitian fundamental jangka panjang menunjukkan jalannya.
Sistem AI generasi mendatang kemungkinan akan terlihat berbeda dari LLM saat ini. Sistem ini akan menggabungkan elemen model dunia, arsitektur alternatif, dan paradigma pelatihan baru. Sistem ini tidak lagi bergantung pada penskalaan brute-force, melainkan lebih pada representasi yang efisien dan terstruktur. Sistem ini akan belajar dari dunia fisik, bukan hanya teks. Dan sistem ini akan memahami kausalitas, bukan hanya korelasi.
Namun, visi ini membutuhkan waktu, kesabaran, dan kebebasan untuk melakukan riset fundamental. Kondisi seperti ini sulit ditemukan dalam lingkungan pasar saat ini. Tekanan untuk mencapai kesuksesan komersial yang cepat sangatlah besar. Laporan triwulanan dan putaran evaluasi mendominasi agenda. Program riset jangka panjang, yang mungkin membutuhkan waktu bertahun-tahun untuk membuahkan hasil, sulit dibenarkan.
Keputusan LeCun untuk mendirikan perusahaan rintisan di usia 65 merupakan pernyataan yang luar biasa. Ia bisa saja pensiun dengan segala penghargaan dan jaminan tempat dalam sejarah. Namun, ia memilih jalan terjal untuk mengejar visi yang ditolak oleh arus utama industri. Meta akan tetap menjadi mitra, yang berarti perusahaannya akan memiliki sumber daya, setidaknya pada awalnya. Namun, kesuksesannya yang sesungguhnya akan bergantung pada apakah ia dapat menunjukkan di tahun-tahun mendatang bahwa Kecerdasan Mesin Canggih memang unggul.
Transformasi ini akan memakan waktu bertahun-tahun. Sekalipun LeCun benar dan model dunia pada dasarnya unggul, model tersebut masih perlu dikembangkan, dioptimalkan, dan diindustrialisasi. Ekosistem perlu dibangun. Pengembang perlu belajar cara menggunakan perangkat baru. Perusahaan perlu bermigrasi dari LLM ke sistem baru. Fase transisi ini secara historis selalu sulit.
Dari sensasi menjadi kenyataan: Tindakan jangka panjang dalam AI
Kepergian Yann LeCun dari Meta menandai lebih dari sekadar pergantian personel. Hal ini melambangkan ketegangan mendasar antara visi ilmiah dan pragmatisme komersial, antara inovasi jangka panjang dan tuntutan pasar jangka pendek. Revolusi AI saat ini berada di titik balik. Keberhasilan skalabilitas yang mudah telah habis. Langkah selanjutnya akan lebih sulit, mahal, dan tidak pasti.
Bagi investor, ini berarti valuasi selangit dari para pelopor AI saat ini perlu dikaji secara kritis. Bagi perusahaan, ini berarti harapan akan keajaiban produktivitas yang cepat melalui AI mungkin akan pupus. Bagi masyarakat, ini berarti transformasi akan berlangsung lebih lambat dan lebih tidak merata daripada yang digembar-gemborkan.
Pada saat yang sama, fondasinya tetap kokoh. AI bukanlah tren sesaat, melainkan teknologi fundamental yang akan mentransformasi hampir semua sektor ekonomi dalam jangka panjang. Persamaan dengan revolusi industri memang tepat. Seperti saat itu, akan ada pemenang dan pecundang, ekses dan koreksi, pergolakan dan penyesuaian. Pertanyaannya bukanlah apakah arsitektur transformator telah mencapai batas kemampuannya, melainkan seperti apa fase selanjutnya dan siapa yang akan membentuknya.
Taruhan LeCun pada kecerdasan mesin canggih dan model dunia memang berani, tetapi bisa jadi terlalu jauh ke depan. Dalam lima tahun, kita akan tahu apakah melepaskan diri dari arus utama adalah keputusan yang tepat atau apakah industri ini tetap pada jalurnya. Tahun-tahun mendatang akan sangat penting bagi pengembangan kecerdasan buatan jangka panjang dan, akibatnya, bagi masa depan ekonomi dan sosial.
Keahlian kami di AS dalam pengembangan bisnis, penjualan, dan pemasaran
Fokus industri: B2B, digitalisasi (dari AI ke XR), teknik mesin, logistik, energi terbarukan, dan industri
Lebih lanjut tentang itu di sini:
Pusat topik dengan wawasan dan keahlian:
- Platform pengetahuan tentang ekonomi global dan regional, inovasi dan tren khusus industri
- Kumpulan analisis, impuls dan informasi latar belakang dari area fokus kami
- Tempat untuk keahlian dan informasi tentang perkembangan terkini dalam bisnis dan teknologi
- Pusat topik bagi perusahaan yang ingin mempelajari tentang pasar, digitalisasi, dan inovasi industri
Mitra pemasaran global dan pengembangan bisnis Anda
☑️ Bahasa bisnis kami adalah Inggris atau Jerman
☑️ BARU: Korespondensi dalam bahasa nasional Anda!
Saya akan dengan senang hati melayani Anda dan tim saya sebagai penasihat pribadi.
Anda dapat menghubungi saya dengan mengisi formulir kontak atau cukup hubungi saya di +49 89 89 674 804 (Munich) . Alamat email saya adalah: wolfenstein ∂ xpert.digital
Saya menantikan proyek bersama kita.
☑️ Dukungan UKM dalam strategi, konsultasi, perencanaan dan implementasi
☑️ Penciptaan atau penataan kembali strategi digital dan digitalisasi
☑️ Perluasan dan optimalisasi proses penjualan internasional
☑️ Platform perdagangan B2B Global & Digital
☑️ Pelopor Pengembangan Bisnis/Pemasaran/Humas/Pameran Dagang
🎯🎯🎯 Manfaatkan keahlian Xpert.Digital yang luas dan berlipat ganda dalam paket layanan yang komprehensif | BD, R&D, XR, PR & Optimasi Visibilitas Digital

Manfaatkan keahlian Xpert.Digital yang luas dan lima kali lipat dalam paket layanan yang komprehensif | R&D, XR, PR & Optimalisasi Visibilitas Digital - Gambar: Xpert.Digital
Xpert.Digital memiliki pengetahuan mendalam tentang berbagai industri. Hal ini memungkinkan kami mengembangkan strategi khusus yang disesuaikan secara tepat dengan kebutuhan dan tantangan segmen pasar spesifik Anda. Dengan terus menganalisis tren pasar dan mengikuti perkembangan industri, kami dapat bertindak dengan pandangan ke depan dan menawarkan solusi inovatif. Melalui kombinasi pengalaman dan pengetahuan, kami menghasilkan nilai tambah dan memberikan pelanggan kami keunggulan kompetitif yang menentukan.
Lebih lanjut tentang itu di sini:























