Deepseek-R1-0528: Deepseek Update devuelve el modelo de IA chino a la altura de los ojos con los líderes de la industria occidental

Publicado el: 31 de mayo de 2025 / Actualizado el: 31 de mayo de 2025 – Autor: Konrad Wolfenstein

DeepSeek-R1-0528: La actualización de DeepSeek pone al modelo de IA chino a la par de los líderes de la industria occidental – Imagen: Xpert.Digital

La IA de código abierto en su límite: DeepSeek eclipsa a OpenAI y Google

Del 60 al 68: DeepSeek catapulta la IA china de nuevo a la cima

La startup china de IA DeepSeek alcanzó un hito significativo con el lanzamiento de DeepSeek-R1-0528 el 28 de mayo de 2025, redefiniendo el panorama global de la IA. La actualización del modelo de razonamiento de código abierto demuestra mejoras drásticas en el rendimiento, posicionando a DeepSeek por primera vez al nivel de o3 de OpenAI y Google Gemini 2.5 Pro. Cabe destacar que este rendimiento máximo se logra a una fracción del costo y con ponderaciones de modelo completamente abiertas, lo que plantea interrogantes fundamentales sobre el futuro de los sistemas de IA propietarios. La plataforma de calificación independiente Artificial Analysis otorgó al nuevo modelo 68 puntos, un salto de 60 a 68 puntos que corresponde a la diferencia de rendimiento entre OpenAI o1 y o3.

Adecuado para:

DeepSeek y Alibaba: ¿Un gran avance a nivel especializado? El impulso chino de la IA en la atención médica

La actualización y sus mejoras técnicas

DeepSeek-R1-0528 representa una mejora sustancial que logra mejoras significativas en el rendimiento mediante optimizaciones algorítmicas y un mayor uso de recursos computacionales en el postentrenamiento, sin alterar la arquitectura subyacente. La actualización se centra principalmente en mejorar las capacidades de razonamiento, lo que permite, según DeepSeek, "procesos de pensamiento significativamente más profundos". Un ejemplo particularmente impresionante de esta mejora se observa en la prueba de matemáticas AIME 2025, donde la precisión aumentó del 70 % al 87,5 %. Simultáneamente, el promedio de tokens por pregunta aumentó de 12 000 a 23 000 tokens, lo que indica un procesamiento más intensivo.

Además de las mejoras de razonamiento, la actualización introduce importantes nuevas funcionalidades, como salida JSON y llamadas a funciones, una interfaz de usuario optimizada y reducción de alucinaciones. Estas mejoras hacen que el modelo sea mucho más práctico para los desarrolladores y amplían considerablemente su alcance. La disponibilidad se mantiene: los usuarios actuales de la API recibirán la actualización automáticamente, mientras que los pesos del modelo seguirán estando disponibles bajo la licencia abierta del MIT en Hugging Face.

Rendimiento de referencia y comparaciones de rendimiento

Los resultados de referencia de DeepSeek-R1-0528 muestran mejoras impresionantes en todas las categorías de evaluación. En tareas matemáticas, la puntuación de AIME-2024 aumentó del 79,8 % al 91,4 %, la de HMMT-2025 del 41,7 % al 79,4 % y la de CNMO-2024 del 78,8 % al 86,9 %. Estos resultados posicionan al modelo como uno de los sistemas de IA más potentes a nivel mundial para la resolución de problemas matemáticos.

DeepSeek-R1-0528 también muestra un progreso significativo en las pruebas de referencia de programación. LiveCodeBench mejoró del 63,5 % al 73,3 %, Aider-Polyglot del 53,3 % al 71,6 % y SWE Verified del 49,2 % al 57,6 %. La calificación de Codeforces ascendió de 1530 a 1930 puntos, lo que sitúa al modelo entre los mejores solucionadores de problemas algorítmicos. En comparación con los modelos de la competencia, DeepSeek-R1 alcanza el 49,2 % en SWE Verified, situándose justo por delante de OpenAI o1-1217 con un 48,9 %, mientras que en Codeforces, con 96,3 percentiles y una calificación Elo de 2029 puntos, se acerca mucho al modelo líder de OpenAI.

Las pruebas de conocimientos generales y lógica confirman la amplia mejora del rendimiento: GPQA-Diamond aumentó del 71,5 % al 81 %, Humanity's Last Exam del 8,5 % al 17,7 %, MMLU-Pro del 84 % al 85 % y MMLU-Redux del 92,9 % al 93,4 %. Solo SimpleQA de OpenAI mostró una ligera disminución del 30,1 % al 27,8 %. Estas mejoras integrales demuestran que DeepSeek-R1-0528 es competitivo no solo en áreas especializadas, sino en todo el espectro de tareas cognitivas.

Arquitectura técnica e innovaciones

La base técnica de DeepSeek-R1-0528 se basa en una sofisticada arquitectura MoE (Mezcla de Expertos) con 37 000 millones de parámetros activos de un total de 671 000 millones y una longitud de contexto de 128 000 tokens. El modelo implementa aprendizaje por refuerzo avanzado para lograr autoverificación, reflexión multietapa y capacidades de razonamiento similares a las humanas. Esta arquitectura permite al modelo abordar tareas de razonamiento complejas mediante procesos de pensamiento iterativo, lo que lo distingue de los modelos de lenguaje tradicionales.

Un aspecto particularmente innovador es el desarrollo de una variante simplificada, DeepSeek-R1-0528-Qwen3-8B, creada mediante la simplificación del proceso de pensamiento de DeepSeek-R1-0528 para Qwen3-8B-Base tras el entrenamiento. Esta versión reducida alcanza un rendimiento impresionante con un consumo de recursos significativamente menor y funciona en GPU con 8-12 GB de VRAM. En la prueba AIME 2024, el modelo alcanzó un rendimiento de vanguardia entre los modelos de código abierto, con una mejora del 10 % respecto a Qwen3-8B y un rendimiento comparable al de Qwen3-235B-Thinking.

La metodología de desarrollo muestra que DeepSeek recurre cada vez más al postentrenamiento con aprendizaje de refuerzo, lo que resultó en un aumento del 40 % en el consumo de tokens durante la evaluación, de 71 a 99 millones. Esto sugiere que el modelo genera respuestas más largas y profundas sin necesidad de cambios fundamentales en la arquitectura.

Posición de mercado y dinámica competitiva

DeepSeek-R1-0528 se consolida como un serio competidor de los principales modelos propietarios de las empresas tecnológicas occidentales. Según Artificial Analysis, el modelo obtiene 68 puntos, lo que lo sitúa a la par del Gemini 2.5 Pro de Google y por delante de modelos como el Grok 3 mini de xAI, el Llama 4 Maverick de Meta y el Nemotron Ultra de Nvidia. En la categoría de código, DeepSeek-R1-0528 alcanza un nivel justo por debajo del o4-mini y el o3 de OpenAI.

El lanzamiento de la actualización ha tenido un impacto significativo en el panorama global de la IA. El lanzamiento inicial de DeepSeek-R1 en enero de 2025 ya provocó una caída en las acciones tecnológicas fuera de China y puso en entredicho la idea de que escalar la IA requiere una enorme potencia de procesamiento e inversión. Los competidores occidentales respondieron con rapidez: Google introdujo tarifas de acceso con descuento para Gemini, mientras que OpenAI redujo los precios e introdujo un modelo o3 Mini que requiere menos potencia de procesamiento.

Curiosamente, los análisis de estilo de texto de EQBench muestran que el estilo de DeepSeek-R1 está más influenciado por Google que por OpenAI, lo que sugiere que en su desarrollo podrían haberse utilizado resultados más sintéticos de Gemini. Esta observación subraya las complejas influencias y transferencias de tecnología entre diferentes desarrolladores de IA.

Rentabilidad y disponibilidad

Una ventaja competitiva clave de DeepSeek-R1-0528 reside en su excepcional rentabilidad. Su estructura de precios es significativamente más favorable que la de OpenAI: los tokens de entrada cuestan $0,14 por millón de tokens para aciertos de caché y $0,55 por errores de caché, mientras que los tokens de salida cuestan $2,19 por millón. En comparación, OpenAI o1 cobra $15 por tokens de entrada y $60 por tokens de salida por millón, lo que reduce el precio de DeepSeek-R1 entre un 90 % y un 95 %.

Microsoft Azure también ofrece DeepSeek-R1 a precios competitivos: la versión global cuesta $0.00135 para tokens de entrada y $0.0054 para tokens de salida por cada 1,000 tokens, mientras que la versión regional tiene precios ligeramente superiores. Este precio hace que el modelo sea especialmente atractivo para empresas y desarrolladores que desean aprovechar funcionalidades de IA de alta calidad sin los altos costos de las soluciones propietarias.

Su disponibilidad como modelo de código abierto bajo la licencia MIT también permite su uso comercial y modificación sin costo alguno. Los desarrolladores pueden ejecutar el modelo localmente o utilizarlo a través de diversas API, lo que ofrece flexibilidad y control sobre la implementación. Para usuarios con recursos limitados, existe una versión simplificada de 8 mil millones de parámetros, que se ejecuta en hardware de consumo con 24 GB de memoria.

Adecuado para:

La captura de China en inteligencia artificial: el caso Deepseek y el uso de datos estratégicos

La recuperación de China en inteligencia artificial: qué significa el éxito de DeepSeek

DeepSeek-R1-0528 marca un punto de inflexión en el desarrollo global de la IA, demostrando que las empresas chinas pueden desarrollar modelos que compiten con los mejores sistemas occidentales a pesar de las restricciones de exportación impuestas por EE. UU. Esta actualización demuestra que es posible lograr mejoras significativas en el rendimiento sin cambios fundamentales en la arquitectura cuando se emplean eficazmente las optimizaciones posteriores al entrenamiento y el aprendizaje por refuerzo. La combinación de máximo rendimiento, reducción drástica de costes y disponibilidad de código abierto supone un desafío fundamental para los modelos de negocio establecidos en la industria de la IA.

Las reacciones de los competidores occidentales al éxito de DeepSeek ya muestran cambios iniciales en el mercado: reducciones de precios por parte de OpenAI y Google, así como el desarrollo de modelos más eficientes en el uso de recursos. Con el lanzamiento previsto de DeepSeek-R2, inicialmente previsto para mayo de 2025, esta presión competitiva podría intensificarse aún más. El éxito de DeepSeek-R1-0528 demuestra que la innovación en IA no requiere necesariamente grandes inversiones ni recursos informáticos, sino que puede lograrse mediante algoritmos inteligentes y métodos de desarrollo eficientes.

Adecuado para:

Su transformación de IA, integración de IA y experto en la industria de la plataforma de IA

☑️ Nuestro idioma comercial es inglés o alemán.

☑️ NUEVO: ¡Correspondencia en tu idioma nacional!

Konrad Wolfenstein

Estaré encantado de servirle a usted y a mi equipo como asesor personal.

Puedes ponerte en contacto conmigo rellenando el formulario de contacto o simplemente llámame al +49 89 89 674 804 (Múnich) . Mi dirección de correo electrónico es: wolfenstein ∂ xpert.digital

Estoy deseando que llegue nuestro proyecto conjunto.