DeepSeek V3.1 – Alarm untuk OpenAI & Co: AI sumber terbuka Tiongkok menimbulkan tantangan baru bagi penyedia yang mapan
Xpert pra-rilis
Pemilihan suara 📢
Diterbitkan pada: 21 Agustus 2025 / Diperbarui pada: 21 Agustus 2025 – Penulis: Konrad Wolfenstein
DeepSeek V3.1 – Alarm untuk OpenAI & Co: AI sumber terbuka Tiongkok menghadirkan tantangan baru bagi penyedia mapan – Gambar: Xpert.Digital
Model AI baru dari Tiongkok: Model gratis ini 27 kali lebih murah dan langsung menantang ChatGPT
### Alarm untuk OpenAI & Co: AI baru Tiongkok sama canggihnya – tetapi sangat murah. Apa yang melatarbelakanginya? ### DeepSeek V3.1: Serangan AI senyap yang kini menjungkirbalikkan dunia teknologi ### Lupakan AI yang mahal: Mengapa model sumber terbuka Tiongkok ini mengubah segalanya ### AI super baru Tiongkok: Bagaimana Beijing menekan Barat dengan strategi bebas yang radikal ### Lebih baik dan lebih murah daripada pesaing? Apa yang sebenarnya dapat dilakukan oleh AI ajaib baru Tiongkok ###
DeepSeek V3.1 merevolusi lanskap AI (sekali lagi)
Kecerdasan buatan Tiongkok muncul sebagai tantangan serius bagi raksasa teknologi Amerika. Startup DeepSeek yang berbasis di Hangzhou telah mencapai terobosan signifikan dengan model terbarunya, V3.1, yang secara fundamental menantang asumsi tradisional tentang pengembangan dan pendanaan AI. Model sumber terbuka ini mencapai kinerja sistem proprietary terkemuka dengan biaya pengembangan yang jauh lebih rendah, membuka jalan bagi masa depan kecerdasan buatan.
Cocok untuk:
Inovasi teknis dengan arsitektur hybrid
DeepSeek V3.1 didasarkan pada arsitektur gabungan pakar yang canggih dengan total 685 miliar parameter, dengan 37 miliar di antaranya diaktifkan per token. Teknologi ini memungkinkan pemanfaatan sumber daya yang jauh lebih efisien daripada model tradisional tanpa mengorbankan kinerja.
Fitur unggulan model baru ini adalah arsitektur inferensi hibridanya, yang dapat beralih antara "Mode Berpikir" dan "Mode Non-Berpikir". Dalam Mode Berpikir, sistem mengembangkan proses berpikir internal yang lebih mendalam dan ideal untuk pemecahan masalah kompleks yang membutuhkan penalaran logis bertingkat. Di sisi lain, Mode Non-Berpikir memberikan jawaban yang langsung dan ringkas untuk tugas-tugas yang mengutamakan kecepatan.
Kemajuan teknis lainnya adalah perluasan jendela konteks hingga 128.000 token, setara dengan sekitar 96.000 kata atau dua novel 200 halaman. Kapasitas ini memungkinkan pemrosesan dokumen yang sangat panjang, pemahaman seluruh repositori kode, dan skenario dialog multi-langkah.
Pengembangan lebih lanjut dicapai melalui pendekatan perluasan konteks dua fase. Fase 32.000 token diperluas sepuluh kali lipat menjadi 630 miliar token, sementara fase 128.000 token diperluas 3,3 kali lipat menjadi 209 miliar token. Selain itu, model ini menggunakan format data UE8M0 FP8 untuk kompatibilitas optimal dengan arsitektur perangkat keras modern.
Parameter kinerja dan tolok ukur yang mengesankan
Dalam uji standar, DeepSeek V3.1 mencapai hasil yang luar biasa. Pada uji coba pengkodean Aider yang ternama, model ini mencapai skor 71,6 persen – skor yang menyaingi model-model terkemuka dari OpenAI dan Anthropic. Performa ini sangat mengesankan mengingat biaya yang jauh lebih rendah.
Dalam tugas matematika, DeepSeek V3.1 bahkan mengungguli pesaing yang sudah mapan. Dalam uji Math 500, model ini mencapai 90,2 persen, sementara GPT-4o hanya mencapai 74,6 persen. Dalam uji MMLU-Pro, sistem meningkat 5,3 poin menjadi 81,2, dan dalam uji tolok ukur GPQA, sistem mencapai 9,3 poin menjadi 68,4.
Yang patut dicatat adalah peningkatan dalam tugas penalaran multi-langkah, di mana V3.1 berkinerja 43 persen lebih baik daripada pendahulunya. Kemampuan pemrograman model ini memungkinkannya menghasilkan kode bebas kesalahan hingga 700 baris – kinerja yang menyaingi solusi proprietary yang mahal.
Efisiensi biaya yang revolusioner
Struktur biaya DeepSeek V3.1 membalikkan asumsi sebelumnya tentang pengembangan AI. Tugas pemrograman dengan V3.1 berbiaya sekitar satu dolar, sementara sistem yang sebanding mengenakan biaya hampir 70 dolar untuk tugas serupa. Pengurangan biaya yang signifikan ini membuat teknologi AI canggih dapat diakses oleh perusahaan dan pengembang yang lebih kecil.
Menurut perusahaan, biaya pengembangan model V3 yang mendasarinya hanya sekitar $5,6 juta – hanya sebagian kecil dari ratusan juta dolar yang dihabiskan oleh perusahaan-perusahaan Amerika untuk proyek-proyek serupa. Efisiensi ini dicapai melalui metode pelatihan yang inovatif dan penggunaan perangkat keras yang lebih hemat biaya namun kurang bertenaga.
Harga API DeepSeek jauh lebih rendah dibandingkan pesaingnya. Model obrolan berharga $0,07 per juta token masukan dengan cache hit dan $1,10 per juta token keluaran. Model penalaran berharga $0,14 per token masukan dan $2,19 per token keluaran. Sebagai perbandingan, OpenAI mengenakan biaya sekitar $2 hingga $2,50 per juta token keluaran, sementara harga DeepSeek adalah $0,014.
Pentingnya strategis bagi persaingan AI global
Kesuksesan DeepSeek memiliki implikasi yang luas bagi lanskap AI global. Perusahaan ini menunjukkan bahwa kinerja AI tingkat lanjut tidak lagi membutuhkan sumber daya besar dan pendekatan kepemilikan yang menjadi ciri khas pengembangan AI di Amerika hingga saat ini. Perkembangan ini menantang fondasi model bisnis yang ada.
Kepemimpinan Tiongkok sangat mementingkan kepentingan strategis DeepSeek, sebagaimana dibuktikan oleh sambutan yang diberikan Perdana Menteri Li Qiang kepada pendirinya, Liang Wenfeng. Perusahaan ini dipandang sebagai fondasi penting bagi ambisi Tiongkok untuk menjadi pemimpin global dalam kecerdasan buatan pada tahun 2030.
Strategi sumber terbuka DeepSeek memungkinkan perusahaan dan peneliti lain di seluruh dunia untuk memanfaatkan kemajuannya dan mengembangkan inovasi mereka sendiri. Hal ini mendorong pengembangan teknologi AI yang terdesentralisasi dan mengurangi ketergantungan pada raksasa teknologi individual.
Latar belakang dan struktur perusahaan
DeepSeek didirikan di Hangzhou pada tahun 2023 oleh Liang Wenfeng dan didanai sepenuhnya oleh perusahaan investasi lindung nilai Tiongkok, High-Flyer. Wenfeng, lahir pada tahun 1985 sebagai putra seorang guru sekolah dasar, mengembangkan minat dalam penerapan AI di sektor keuangan saat kuliah di Universitas Zhejiang.
Pada tahun 2016, Wenfeng mendirikan High-Flyer, sebuah hedge fund yang menggunakan pembelajaran mesin untuk strategi perdagangan kuantitatif. Pada tahun 2021, perusahaan tersebut telah sepenuhnya beralih ke pendekatan perdagangan berbasis AI dan berkembang menjadi salah satu reksa dana kuantitatif terkemuka di Tiongkok dengan aset kelolaan lebih dari 100 miliar RMB.
Bahkan sebelum mendirikan DeepSeek, Wenfeng sudah membeli ribuan GPU Nvidia – yang awalnya diejek sebagai hobi eksentrik seorang miliarder. Investasi perangkat keras yang berwawasan luas ini kemudian memungkinkan perusahaan mengembangkan model AI yang kompetitif meskipun ada pembatasan ekspor di AS.
Keamanan Data EU/DE | Integrasi platform AI sumber data independen dan lintas data untuk semua kebutuhan bisnis
Ki-gamechanger: Platform AI paling fleksibel – solusi yang dibuat khusus yang mengurangi biaya, meningkatkan keputusan mereka dan meningkatkan efisiensi
Platform AI Independen: mengintegrasikan semua sumber data perusahaan yang relevan
- Integrasi AI Cepat: Solusi AI yang dibuat khusus untuk perusahaan dalam beberapa jam atau hari bukan bulan
- Infrastruktur Fleksibel: Berbasis cloud atau hosting di pusat data Anda sendiri (Jerman, Eropa, pilihan lokasi bebas)
- Keamanan Data Tertinggi: Penggunaan di Firma Hukum adalah bukti yang aman
- Gunakan di berbagai sumber data perusahaan
- Pilihan model AI Anda sendiri atau berbagai (DE, EU, USA, CN)
Lebih lanjut tentang itu di sini:
Chip, algoritma, inovasi: Jalan DeepSeek menuju kepemimpinan dunia
Dampak kontrol ekspor AS
Keberhasilan DeepSeek sangat luar biasa mengingat pembatasan ekspor chip AI canggih yang diberlakukan AS ke Tiongkok. Meskipun sanksi tersebut bertujuan untuk membatasi kemampuan Tiongkok dalam mengembangkan sistem AI canggih, DeepSeek menunjukkan bahwa pendekatan perangkat lunak yang inovatif dan penggunaan sumber daya yang efisien dapat mengatasi keterbatasan ini.
Perusahaan tersebut menggunakan chip H800 yang kurang bertenaga dan telah disetujui untuk diekspor ke Tiongkok, tetapi tetap mencapai kinerja terbaik melalui algoritma yang dioptimalkan dan metode pelatihan yang efisien. Pendekatan ini mempertanyakan efektivitas sanksi teknologi dan menyoroti jalur alternatif untuk pengembangan AI.
Para ahli melihat terobosan DeepSeek sebagai titik balik yang dapat mengubah secara fundamental perkiraan yang ada tentang kemampuan dan potensi AI Tiongkok. Perkembangan ini menunjukkan bahwa inovasi dalam optimasi perangkat lunak mungkin lebih penting daripada keunggulan perangkat keras semata.
Cocok untuk:
Open source sebagai keunggulan kompetitif
Strategi sumber terbuka DeepSeek menawarkan beberapa keuntungan strategis. Pengembang dan perusahaan di seluruh dunia dapat menjalankan model ini secara lokal, menyesuaikannya, dan mengintegrasikannya ke dalam proyek mereka sendiri tanpa bergantung pada layanan cloud. Hal ini khususnya penting bagi aplikasi yang sensitif terhadap data dan perusahaan yang ingin mempertahankan kendali atas informasi mereka.
Pengembangan berbasis komunitas memungkinkan perbaikan bug yang lebih cepat, peningkatan berkelanjutan, dan basis kontributor yang luas. Di saat yang sama, pendekatan sumber terbuka mendemokratisasi akses ke teknologi AI canggih dan mendorong inovasi, bahkan di antara perusahaan-perusahaan kecil dan di negara-negara berkembang.
Berbeda dengan model proprietary yang hanya dapat diakses melalui API atau platform cloud, AI sumber terbuka menawarkan ketersediaan jangka panjang dan independensi dari masing-masing penyedia. Pengguna tidak perlu khawatir tentang kenaikan harga, pembatasan akses, atau penghentian layanan.
Terobosan dan inovasi teknologi
DeepSeek V3.1 mengintegrasikan beberapa teknologi inovatif yang memungkinkan efisiensinya yang luar biasa. Arsitektur perhatian laten multi-head mengompresi cache nilai kunci menggunakan vektor laten, mengurangi konsumsi memori dan overhead komputasi selama inferensi.
Metode prediksi multi-token memungkinkan setiap token memprediksi beberapa token mendatang secara bersamaan. Hal ini mengatasi hambatan signifikan yang terdapat pada model autoregresif tradisional dan meningkatkan akurasi serta kecepatan inferensi.
Penggunaan pelatihan 8-bit secara signifikan mengurangi kebutuhan dan biaya memori tanpa mengurangi akurasi. Teknik ini telah lama dianggap bermasalah, tetapi DeepSeek menunjukkan bahwa, jika diterapkan dengan benar, teknik ini menghasilkan hasil yang sebanding dengan metode konvensional.
Reaksi dan dampak pasar
Pengumuman DeepSeek V3.1 memicu reaksi keras di pasar keuangan. Nvidia kehilangan kapitalisasi pasar lebih dari $600 miliar – kerugian tunggal terbesar dalam sejarah pasar saham AS. Perusahaan perangkat keras AI lainnya juga mencatat penurunan harga saham yang signifikan.
Para investor dan analis sedang mempertimbangkan kembali penilaian mereka terhadap industri AI. Kesuksesan DeepSeek menantang asumsi bahwa investasi besar-besaran dalam perangkat keras dan pengembangan yang bersifat kepemilikan merupakan prasyarat penting bagi AI mutakhir.
Perusahaan-perusahaan Barat sudah menguji model DeepSeek dalam alur kerja mereka. Salah satu contoh menonjol adalah Merck, yang Chief Data Officer-nya secara terbuka mendemonstrasikan integrasi DeepSeek sebagai salah satu dari beberapa opsi AI ke dalam proses internal.
Perkembangan dan prospek masa depan
DeepSeek memposisikan V3.1 sebagai langkah pertama menuju "era agen" AI. Model ini telah dioptimalkan secara khusus untuk pemanfaatan alat yang lebih baik dan tugas agen multi-langkah. Optimasi pasca-pelatihan telah menghasilkan peningkatan signifikan dalam penggunaan alat eksternal dan tugas pencarian yang kompleks.
Kecepatan pengembangan DeepSeek menunjukkan bahwa model V4 mungkin dirilis sebelum rilis R2 OpenAI berikutnya. Momentum ini dapat mempercepat siklus pengembangan tradisional industri AI dan menetapkan standar baru untuk frekuensi pembaruan.
Kesuksesan DeepSeek telah menginspirasi perusahaan dan peneliti AI Tiongkok lainnya di seluruh dunia. Model sumber terbuka semakin dipandang sebagai alternatif yang valid untuk solusi proprietary, yang dapat menghasilkan lanskap AI yang lebih beragam dan kompetitif.
Tantangan dan kritik
Meskipun performanya mengesankan, DeepSeek juga menghadapi kritik. Seperti model AI Tiongkok lainnya, DeepSeek tunduk pada langkah-langkah sensor tertentu, yang dapat digunakan di area yang sensitif secara politik. Namun, pembatasan ini seringkali dapat dielakkan melalui penyesuaian teknis.
Transparansi terkait data dan metode pelatihan terbatas. Ada spekulasi bahwa pelatihan sebagian didasarkan pada respons dari ChatGPT, karena DeepSeek terkadang mengklaim sebagai ChatGPT itu sendiri. Ketidakjelasan ini menimbulkan pertanyaan tentang orisinalitas dan potensi masalah hak cipta.
Perkembangan pesat dan harga rendah model DeepSeek juga menimbulkan kekhawatiran tentang keberlanjutan model bisnis tersebut. Para kritikus mempertanyakan apakah harga yang sangat rendah ini dapat dipertahankan dalam jangka panjang atau apakah harga tersebut merupakan bagian dari upaya penetrasi pasar yang strategis.
Implikasi global bagi industri AI
DeepSeek V3.1 menandai titik balik dalam pengembangan AI global. Model ini membuktikan bahwa pendekatan perangkat lunak yang inovatif dan pemanfaatan sumber daya yang efisien dapat lebih penting daripada investasi modal besar-besaran dan akses ke perangkat keras terbaru. Wawasan ini akan memengaruhi strategi semua perusahaan AI besar.
Demokratisasi teknologi AI canggih melalui model sumber terbuka dapat menghasilkan distribusi kapabilitas AI yang lebih merata di seluruh dunia. Negara dan perusahaan yang sebelumnya terpinggirkan karena biaya tinggi atau hambatan teknis akan mendapatkan akses ke teknologi mutakhir.
Di saat yang sama, keberhasilan DeepSeek mempertanyakan efektivitas sanksi teknologi dan kontrol ekspor. Kemampuan untuk mencapai kinerja kelas dunia dengan sumber daya terbatas dapat mendorong negara lain untuk menerapkan pendekatan serupa dan mengembangkan ekosistem AI mereka sendiri.
DeepSeek V3.1 mewakili lebih dari sekadar model AI biasa – ia melambangkan perubahan mendasar dalam cara AI dikembangkan, didanai, dan disebarluaskan. Kombinasi inovasi teknis, pengembangan yang hemat biaya, dan ketersediaan sumber terbuka menciptakan peluang baru dan menimbulkan tantangan serius bagi para pemimpin pasar yang mapan. Perkembangan selanjutnya akan menunjukkan apakah pendekatan ini akan membentuk masa depan industri AI.
Kami ada untuk Anda – Saran – Perencanaan – Implementasi – Manajemen Proyek
☑️ Dukungan UKM dalam strategi, konsultasi, perencanaan dan implementasi
☑️ Penciptaan atau penataan kembali strategi AI
☑️ Pelopor Pengembangan Bisnis
Saya akan dengan senang hati menjadi penasihat pribadi Anda.
Anda dapat menghubungi saya dengan mengisi formulir kontak di bawah ini atau cukup hubungi saya di +49 89 89 674 804 (Munich) .
Saya menantikan proyek bersama kita.
Xpert.Digital – Konrad Wolfenstein
Xpert.Digital adalah pusat industri dengan fokus pada digitalisasi, teknik mesin, logistik/intralogistik, dan fotovoltaik.
Dengan solusi pengembangan bisnis 360°, kami mendukung perusahaan terkenal mulai dari bisnis baru hingga purna jual.
Kecerdasan pasar, pemasaran, otomasi pemasaran, pengembangan konten, PR, kampanye surat, media sosial yang dipersonalisasi, dan pemeliharaan prospek adalah bagian dari alat digital kami.
Anda dapat menemukan lebih banyak di: www.xpert.digital – www.xpert.solar – www.xpert.plus