DeepSeek-R1-0528: Pembaruan DeepSeek membawa model AI Tiongkok kembali setara dengan pemimpin industri Barat

Konrad Wolfenstein

1 tahun yang lalu

DeepSeek-R1-0528: Pembaruan DeepSeek membawa model AI Tiongkok kembali setara dengan pemimpin industri Barat – Gambar: Xpert.Digital

AI sumber terbuka mencapai batasnya: DeepSeek mengungguli OpenAI dan Google

Dari 60 ke 68: DeepSeek melambungkan kembali AI Tiongkok ke puncak

Startup AI Tiongkok, DeepSeek, mencapai tonggak penting dengan merilis DeepSeek-R1-0528 pada 28 Mei 2025, yang mendefinisikan ulang lanskap AI global. Pembaruan pada model penalaran sumber terbuka ini menunjukkan peningkatan kinerja yang dramatis, menempatkan DeepSeek untuk pertama kalinya setara dengan OpenAI o3 dan Google Gemini 2.5 Pro. Yang patut diperhatikan adalah bahwa kinerja puncak ini dicapai dengan biaya yang jauh lebih rendah dan dengan bobot model yang sepenuhnya terbuka, yang menimbulkan pertanyaan mendasar tentang masa depan sistem AI berpemilik. Platform penilaian independen Artificial Analysis memberi skor model baru ini 68 poin – peningkatan dari 60 menjadi 68 poin yang sesuai dengan perbedaan kinerja antara OpenAI o1 dan o3.

Berkaitan dengan ini:

DeepSeek dan Alibaba: Terobosan di tingkat spesialis? Dorongan AI Tiongkok di bidang perawatan kesehatan.

Pembaruan dan peningkatan teknisnya

DeepSeek-R1-0528 menghadirkan peningkatan substansial yang mencapai peningkatan kinerja signifikan melalui optimasi algoritma dan peningkatan penggunaan sumber daya komputasi dalam pasca-pelatihan, tanpa mengubah arsitektur dasarnya. Pembaruan ini terutama berfokus pada peningkatan kemampuan penalaran, yang menurut DeepSeek, memungkinkan "proses berpikir yang jauh lebih mendalam." Contoh yang sangat mengesankan dari peningkatan ini terlihat pada tes matematika AIME 2025, di mana akurasi meningkat dari 70 persen menjadi 87,5 persen. Secara bersamaan, jumlah rata-rata token per pertanyaan meningkat dari 12.000 menjadi 23.000 token, menunjukkan pemrosesan yang lebih intensif.

Selain peningkatan penalaran, pembaruan ini memperkenalkan fungsionalitas baru yang penting, termasuk output JSON dan panggilan fungsi, antarmuka pengguna yang dioptimalkan, dan pengurangan halusinasi. Peningkatan ini membuat model jauh lebih praktis bagi pengembang dan secara signifikan memperluas cakupannya. Ketersediaan tetap tidak berubah: Pengguna API yang sudah ada akan menerima pembaruan secara otomatis, sementara bobot model akan terus tersedia di bawah lisensi MIT terbuka di Hugging Face.

Tolok ukur kinerja dan perbandingan kinerja

Hasil benchmark untuk DeepSeek-R1-0528 menunjukkan peningkatan yang mengesankan di semua kategori evaluasi. Dalam tugas matematika, skor AIME-2024 meningkat dari 79,8 menjadi 91,4 persen, HMMT-2025 dari 41,7 menjadi 79,4 persen, dan CNMO-2024 dari 78,8 menjadi 86,9 persen. Hasil ini menempatkan model tersebut sebagai salah satu sistem AI paling ampuh untuk pemecahan masalah matematika di seluruh dunia.

DeepSeek-R1-0528 juga menunjukkan kemajuan signifikan dalam benchmark pemrograman. LiveCodeBench meningkat dari 63,5 menjadi 73,3 persen, Aider-Polyglot dari 53,3 menjadi 71,6 persen, dan SWE Verified dari 49,2 menjadi 57,6 persen. Peringkat Codeforces naik dari 1.530 menjadi 1.930 poin, menempatkan model ini di antara pemecah masalah algoritmik teratas. Dibandingkan dengan model pesaing, DeepSeek-R1 mencapai 49,2 persen di SWE Verified, menempatkannya sedikit di depan OpenAI o1-1217 dengan 48,9 persen, sementara di Codeforces, dengan persentil 96,3 dan peringkat Elo 2.029 poin, ia sangat mendekati model unggulan OpenAI.

Tes pengetahuan umum dan logika mengkonfirmasi peningkatan kinerja yang luas: GPQA-Diamond meningkat dari 71,5 menjadi 81,0 persen, Humanity's Last Exam dari 8,5 menjadi 17,7 persen, MMLU-Pro dari 84,0 menjadi 85,0 persen, dan MMLU-Redux dari 92,9 menjadi 93,4 persen. Hanya SimpleQA dari OpenAI yang menunjukkan sedikit penurunan dari 30,1 menjadi 27,8 persen. Peningkatan komprehensif ini menunjukkan bahwa DeepSeek-R1-0528 kompetitif tidak hanya di bidang khusus tetapi di seluruh spektrum tugas kognitif.

Arsitektur teknis dan inovasi

Landasan teknis DeepSeek-R1-0528 didasarkan pada arsitektur MoE (Mixture of Experts) yang canggih dengan 37 miliar parameter aktif dari total 671 miliar parameter dan panjang konteks 128.000 token. Model ini mengimplementasikan pembelajaran penguatan tingkat lanjut untuk mencapai verifikasi mandiri, refleksi multi-tahap, dan kemampuan penalaran seperti manusia. Arsitektur ini memungkinkan model untuk menangani tugas penalaran kompleks melalui proses berpikir iteratif, yang membedakannya dari model bahasa tradisional.

Salah satu aspek yang sangat inovatif adalah pengembangan varian yang lebih ringkas, DeepSeek-R1-0528-Qwen3-8B, yang dibuat dengan menyederhanakan proses berpikir DeepSeek-R1-0528 untuk pelatihan pasca-model Qwen3-8B-Base. Versi yang lebih kecil ini mencapai kinerja yang mengesankan dengan kebutuhan sumber daya yang jauh lebih rendah dan berjalan pada GPU dengan VRAM 8-12 GB. Dalam uji AIME 2024, model ini mencapai kinerja terbaik di antara model open-source, dengan peningkatan 10 persen dibandingkan Qwen3-8B dan kinerja yang sebanding dengan Qwen3-235B-Thinking.

Metodologi pengembangan menunjukkan bahwa DeepSeek semakin bergantung pada pelatihan pasca-pemodelan dengan pembelajaran penguatan (reinforcement learning), yang menyebabkan peningkatan konsumsi token sebesar 40% selama evaluasi – dari 71 menjadi 99 juta token. Hal ini menunjukkan bahwa model tersebut menghasilkan jawaban yang lebih panjang dan lebih mendalam tanpa memerlukan perubahan arsitektur mendasar.

Posisi pasar dan dinamika persaingan

DeepSeek-R1-0528 memantapkan posisinya sebagai pesaing serius bagi model-model unggulan milik perusahaan teknologi Barat. Menurut Artificial Analysis, model ini mencetak 68 poin, menempatkannya setara dengan Gemini 2.5 Pro milik Google dan di atas model-model seperti Grok 3 mini milik xAI, Llama 4 Maverick milik Meta, dan Nemotron Ultra milik Nvidia. Dalam kategori kode, DeepSeek-R1-0528 mencapai level tepat di bawah o4-mini dan o3 milik OpenAI.

Peluncuran pembaruan ini telah memberikan dampak signifikan pada lanskap AI global. Peluncuran awal DeepSeek-R1 pada Januari 2025 telah menyebabkan penurunan saham teknologi di luar China dan menantang asumsi bahwa peningkatan skala AI membutuhkan daya komputasi dan investasi yang sangat besar. Para pesaing Barat merespons dengan cepat: Google memperkenalkan tarif akses diskon untuk Gemini, sementara OpenAI menurunkan harga dan memperkenalkan model o3 Mini yang membutuhkan daya komputasi lebih sedikit.

Menariknya, analisis gaya teks dari EQBench menunjukkan bahwa gaya DeepSeek-R1 lebih dipengaruhi oleh Google daripada OpenAI, yang mengindikasikan bahwa lebih banyak keluaran Gemini sintetis mungkin telah digunakan dalam pengembangannya. Pengamatan ini menggarisbawahi pengaruh kompleks dan transfer teknologi antara pengembang AI yang berbeda.

Efisiensi biaya dan ketersediaan

Keunggulan kompetitif utama DeepSeek-R1-0528 terletak pada efisiensi biayanya yang luar biasa. Struktur harganya jauh lebih menguntungkan daripada OpenAI: Token input berharga $0,14 per juta token untuk cache hit dan $0,55 untuk cache miss, sedangkan token output berharga $2,19 per juta token. Sebagai perbandingan, OpenAI o1 mengenakan biaya $15 untuk token input dan $60 untuk token output per juta, sehingga DeepSeek-R1 90-95 persen lebih murah.

Microsoft Azure juga menawarkan DeepSeek-R1 dengan harga kompetitif: Versi global berharga $0,00135 untuk token input dan $0,0054 untuk token output per 1.000 token, sedangkan versi regional memiliki harga sedikit lebih tinggi. Penetapan harga ini membuat model tersebut sangat menarik bagi perusahaan dan pengembang yang ingin memanfaatkan fungsionalitas AI berkualitas tinggi tanpa biaya tinggi dari solusi berpemilik.

Ketersediaannya sebagai model sumber terbuka di bawah lisensi MIT juga memungkinkan penggunaan dan modifikasi komersial tanpa biaya lisensi. Pengembang dapat menjalankan model secara lokal atau menggunakannya melalui berbagai API, menawarkan fleksibilitas dan kontrol atas implementasi. Bagi pengguna dengan sumber daya terbatas, tersedia versi ringkas dengan 8 miliar parameter, yang berjalan pada perangkat keras konsumen dengan memori 24 GB.

Berkaitan dengan ini:

Upaya China mengejar ketertinggalan dalam kecerdasan buatan: Kasus DeepSeek dan penggunaan data secara strategis

Upaya China mengejar ketertinggalan di bidang AI: Apa arti kesuksesan DeepSeek?

DeepSeek-R1-0528 menandai titik balik dalam pengembangan AI global, menunjukkan bahwa perusahaan-perusahaan Tiongkok dapat mengembangkan model yang mampu bersaing dengan sistem-sistem terbaik Barat meskipun ada pembatasan ekspor AS. Pembaruan ini membuktikan bahwa peningkatan kinerja yang signifikan dimungkinkan tanpa perubahan arsitektur mendasar ketika optimasi pasca-pelatihan dan pembelajaran penguatan (reinforcement learning) diterapkan secara efektif. Kombinasi kinerja puncak, pengurangan biaya yang drastis, dan ketersediaan sumber terbuka secara fundamental menantang model bisnis yang sudah mapan di industri AI.

Reaksi para pesaing Barat terhadap kesuksesan DeepSeek sudah menunjukkan perubahan pasar awal: penurunan harga dari OpenAI dan Google, serta pengembangan model yang lebih hemat sumber daya. Dengan peluncuran DeepSeek-R2 yang diantisipasi, yang awalnya direncanakan untuk Mei 2025, tekanan kompetitif ini dapat semakin meningkat. Kisah sukses DeepSeek-R1-0528 menunjukkan bahwa inovasi dalam AI tidak selalu membutuhkan investasi besar dan sumber daya komputasi, tetapi dapat dicapai melalui algoritma cerdas dan metode pengembangan yang efisien.

Berkaitan dengan ini:

Pakar industri transformasi AI, integrasi AI, dan platform AI Anda

☑️ Bahasa bisnis kami adalah bahasa Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa ibu Anda!

Konrad Wolfenstein

Saya dan tim saya dengan senang hati siap membantu Anda sebagai penasihat pribadi Anda.

Anda dapat menghubungi saya dengan mengisi formulir kontak di sini wolfenstein@xpert.digital:atau cukup hubungi saya di +49 7348 4088 965. Alamat email saya adalah

Saya sangat menantikan proyek bersama kita.

DeepSeek-R1-0528: Pembaruan DeepSeek membawa model AI Tiongkok kembali setara dengan pemimpin industri Barat

AI sumber terbuka mencapai batasnya: DeepSeek mengungguli OpenAI dan Google