Publicado el 25 de julio de 2025 / Actualización del: 25 de julio de 2025 – Autor: Konrad Wolfenstein
Géminis gotas de inteligencia artificial: el nuevo ritmo mensual de Google para las innovaciones de IA – Imagen: xpert.digital
Géminis Drops: Cómo Google cambió el mundo de la IA paso a paso
Futuro de la inteligencia artificial: Hoja de ruta de innovación inteligente de Google
Google cambia al modo explicativo permanente en su ecosistema de IA: con nuevas "gemini gotas", el grupo recopila todas las funciones frescas en torno a su modelo multimodal Gemini, la API de desarrollador, la aplicación Gemini y los productos vinculados (píxeles, Ose OS, Chrome, Space, Services Cloud y más) en un paquete mensual. La idea se relaciona con las conocidas caídas de la función Android y Pixel, pero va un paso más allá: cada caída no solo proporciona una lista de cambios sobrios, sino que también cuenta una historia continua sobre dónde se mueve Google AI – desde la generación de video y audio hasta las rutinas cotidianas automatizadas.
El siguiente tratado lleva en detalle a través del concepto, explica antecedentes, describe innovaciones concretas de las primeras gotas, clasifica todo en el horario de Géminis más grande y se atreve a echar un vistazo al futuro. Todas las citas de comunicados de prensa, blogs o presentaciones se transfieren a textos de flujo coherentes, y el estilo se mantiene deliberadamente en general.
Adecuado para:
- La nueva IA de Google ahora puede "pensar profundamente": más que solo respuestas – más rápido, más inteligente y suena más humano que nunca
Un nuevo capítulo en la estrategia de IA de Google
Desde la presentación de la primera generación de Géminis a fines de 2023, Google acelera constantemente el ritmo de la innovación. Lo que inicialmente comenzó como un modelo de lenguaje e imagen se convirtió rápidamente en un sistema multimodal nativo que procesa textos, imágenes, audio, video y código en igualdad de condiciones. Al mismo tiempo, el ecosistema Gemini creció: una aplicación de usuario final, una API de desarrollador, integraciones en Chrome, búsqueda, aplicaciones de espacio de trabajo, funciones de píxeles, relojes Wear OS, pantallas inteligentes e incluso futuras interfaces de automóviles.
Con cada nueva actualización del producto, las preguntas toman:
- ¿Qué funciones son gratuitas para todos, que solo están en la suscripción AI-Pro o Ai-Ultra?
- ¿Qué puede el modelo básico, qué puede avanzarse Gemini 2.5 Pro, Flash o Flash-Lite?
- ¿Dónde están las características frescas como VEO 3-Videoogenización, salida de audio nativa o acciones programadas?
Para limpiar este matorral, Google ahora estableció las gotas de Géminis. Una vez que proinmal por mes, aparece una descripción generalizada que resalta los aspectos más destacados centrales, proporciona aplicaciones de muestra, responde preguntas frecuentes y se refiere a recursos adicionales. Las pequeñas correcciones de errores o las mejoras incrementales continúan implementándose de inmediato, pero la caída lo resume todo y lo explica de manera comprensible.
Por qué estas gemitas tienen sentido
Google a menudo desarrolla sus modelos de IA en el fondo en Micro Steps. Aunque estos cambios están documentados en los coros de desarrolladores, rara vez se encuentra su camino en la percepción de los usuarios normales. Aquí es exactamente donde entran las gotas. Ella ...
- Funciones del paquete: en lugar de mini actualizaciones dispersas, los usuarios reciben un catálogo curado de nuevas posibilidades.
- Prioridades establecidas: cada caída enfatiza 4-6 mejoras básicas que Google clasifica como particularmente valiosas.
- Entregue ejemplos prácticos: videos cortos, GIF animados o guías paso a paso ilustran cómo probar las innovaciones de inmediato.
- Soporte de Facking: una fecha de clave clara simplifica los foros de ayuda porque todos saben a qué funcional referirse.
- Fortalecimiento del marketing: las caídas de características tienen un estado de culto en los fanáticos de Android y Pixel. El concepto se puede transferir a IA para atraer la atención y despertar curiosidad.
Más sobre esto aquí:
La primera caída de Géminis en julio de 2025 – una gira
El estreno es abundante y muestra cuán multicapa son los planes de IA de Google ahora. Los componentes más importantes:
Veo 3: Photo-to-Video con sonido
El punto culminante superior es una actualización del generador de video VEO 3, que ahora se encuentra directamente en la aplicación Gemini. Los usuarios eligen una imagen de una imagen de la galería – un retrato, una foto de paisaje, un boceto – y VEO construye un clip de ocho veces en 720p, incluido el fondo de ruido generado automáticamente y la cama de música. Si lo desea, combine varias imágenes en una secuencia de guiones gráficos.
- Posibilidades: publicaciones en redes sociales, tarjetas de cumpleaños en movimiento, clips de humor corto para presentaciones.
- Controles: parámetros de estilo (cinemato, cómico, stop movimiento), indicaciones negativas (elementos que se excluirán) y prensas de movimiento (paseo en cámara, zoom, giro de 360 grados).
- Antecedentes de tecnología: VEO 3 domina la representación de caracteres consistente, el control de la cámara y la síntesis de audio nativo; Utiliza los mismos módulos de difusión y transformador que Gemini 2.5 Pro.
Géminis en Wear OS
Google está implementando gradualmente Gemini en todos los usos de OS 4 en punto y otros nuevos. El Bot de chat reemplaza al Asistente de Google clásico, pero ofrece una comprensión de lenguaje considerablemente más lengua, acceso a datos de correo electrónico y calendario, atajos de navegación y código espontáneo o soluciones matemáticas directamente en la muñeca.
– ”permanece, alternativamente, mantiene el nuevo icono de la aplicación.
– Acceso de contexto: resúmenes de los últimos correos electrónicos antes de la reunión, recordando el número de casillero en el gimnasio, en las direcciones de la manera en que Maps -Snippet.
– Especialidad de hardware: los relojes más antiguos transmiten el trabajo de transmisión de teléfonos inteligentes acoplados (por ejemplo, Snapdragon W5+) admiten las inferencias locales para tareas básicas.
Acciones programadas – rutinas sobre esteroides
Con acciones programadas, Gemini se convierte en un automator de flujo de trabajo personal. Los usuarios determinan un cronograma para el aviso promocional popular: diario, semanal, mensual o único.
- Ejemplos: a las 7 a.m., un resumen del calendario, clima, correos electrónicos y la lista de tareas pendientes.
- Cinco ideas de blog los lunes; Una lista de restaurantes en el área los viernes; Una revisión semanal los domingos.
- Envíe las estadísticas de coincidencia al teléfono celular después de eventos deportivos.
- Límites: hasta diez acciones activas, características actualmente en AI-Pro/Ultra suscripción o planes de espacio de trabajo calificados.
- Operación: creación por orden de chat, administre en "acciones programadas" en la configuración; Pausa/reanudación posible.
Gemini 2.5 Pro – Más razonamiento, más contexto
Paralelamente a las funciones del usuario final, Google publica el modelo de pensamiento Gemini 2.5 Pro en GA.
- Datos de rendimiento: 1 millón de ventanas token, entradas multimodales, resultados superiores en la codificación de referencia, Lmarena Rank 1.
- Camisetas para desarrolladores: llamadas de función asíncrona de cadena de pensamiento, herramientas de ejecución de código en vivo, API-Audio-Dialog.
- Precios: en la aplicación Gemini como parte de AI -Pro (20 USD/mes) o AI -Ultra ($ 120/año) – -Bird Testers obtienen acceso gratuito temporalmente.
Subtítulos en vivo para Géminis en vivo
Gemini Live, el módulo de conversación en tiempo real, ahora muestra subtítulos en tiempo real. Bueno para entornos accesibilidad y ruidosos, prácticamente también como una transcripción para las reuniones.
El ganado pequeño también hace basura
- Aplicaciones de Gemini: Docios más profundos, mantenimiento y acceso a mensajes, incluida la integración de los resultados de IA.
- Asistente de la nube de Gemini: código de asistencia de código mejorado en Google Cloud con la configuración del conector del lenguaje de la naturaleza.
- Lyria-Realime: creación de música en sesiones en vivo (vista previa).
- Flash-Lite: incluso más barato para tareas de inferencia de masa.
La mecánica detrás de las gotas
Cada gota sigue un proceso claro:
- Despliaje suave – las funciones individuales aparecen paso a paso, a menudo emparejadas con banderas del lado del servidor.
- Drop-Tag – Google publica una publicación de blog, activos sociales, un corto de YouTube y actualiza la página Gemini-Drops-Hub.
- Actualización del HUB – Sección de preguntas frecuentes, demostraciones de video, enlaces de desarrollador-profundidad.
- Feedback -Window – la retroalimentación del usuario fluye a las hotías dentro de las 48 horas; Los equipos internos ajustan las banderas de características.
De esta manera, Google Agility (constante implementación) y la narrativa (historias mensuales) se combinan sin perder la velocidad de innovación.
Gemini gotas en comparación con las caídas de funciones de Android y Pixel
En el mundo dinámico de la tecnología, las actualizaciones de software se desarrollan con diferentes estrategias. Mientras que Android y Pixel realizan tradicionalmente caídas de funciones, Gemini se basa en un ciclo mensual que representa mejor el rápido desarrollo de tecnologías de IA.
Las caídas de la característica difieren no solo en su frecuencia, sino también en su enfoque: las actualizaciones de Android se concentran en las funciones del sistema operativo, las actualizaciones de píxeles ofrecen golosinas exclusivas para dispositivos de Google, y Gemini deja caer el modelo de IA objetivo y las funciones de aplicaciones.
El grupo de usuarios también varía: las actualizaciones de Android alcanzan todos los dispositivos de una determinada versión, las actualizaciones de píxeles se limitan a los dispositivos de píxeles actuales y Gemini Drops influye en la aplicación Gemini, API y productos conectados.
Los mecanismos de distribución van desde despliegos de parches hasta actualizaciones del sistema de Google Play hasta banderas e implementaciones en la nube del lado del servidor. Un ejemplo de la variedad de innovaciones son el soporte de PassKeys, las actualizaciones de la pantalla de llamadas y el videocenerador VEO-3.
El ciclo mensual de Géminis refleja el rápido desarrollo de la inteligencia artificial y se destaca significativamente de los ciclos de actualización más lentos y más lentos de Android y píxeles.
Adecuado para:
Cómo los desarrolladores se benefician de las gotas
Las gotas de Géminis son mucho más que marketing para la comunidad de desarrolladores:
- Propiedad: las citas fijas ayudan a sincronizar los mapas de carreteras y a ser pruebas de compatibilidad.
- Documentación: las notas de lanzamiento en el centro API indican ID de modelo precisos, advertencias de depresión y rutas de migración.
- Tiempo de sandbox: modelos de vista previa como el diálogo de audio nativo `gemini-2.5-flash-preview-nativo se pueden evaluar temprano.
- Ejemplos de código abierto: Google publica los cuadernos Colab que lo acompañan, fragmentos de GitHub y Cloud Codelabs.
- Eventos de la comunidad: después de cada caída, una transmisión de Dev-Live, las sesiones de preguntas y respuestas siguen a Discord y Horas de Oficina en AI Studio.
Beneficio de los clientes de negocios y educación
Las empresas e instituciones educativas reciben a través de las gotas ...
- Información clara de la licencia: ¿Qué funciones se incluyen en los planes del espacio de trabajo, que requieren complementos?
- Actualizaciones de seguridad: cambios de cumplimiento resaltados, p. B. Opciones de residencia de datos para Gemini 2.5 Pro.
- Historias de casos de uso: ejemplos prácticos de bots de servicio al cliente, automatización de CRM, evaluaciones de investigación.
- Material de capacitación: diapositivas, cuentas de demostración y estudios de casos apoyan la capacitación interna.
Críticos y preguntas abiertas
- Barrera de suscripción: muchos aspectos destacados (acciones programadas, 2.5 Pro, VEO 3 en plena calidad) están detrás de AI-Pro/Ultra-Paywalls.
- Fragmentación del modelo: flash -lite, flash, pro, audio nativo, TTS – la gente laica rápidamente pierde la pista.
- Protección de datos: más acceso de contexto (correo, calendario, unidad) requiere confianza en la arquitectura de seguridad de Google.
- Fragmentación del ecosistema: las funciones a veces aparecen en píxeles, luego en iOS, más tarde en la web; Use OS-Rollouts.
Google responde con portales de transparencia, tarjetas modelo detalladas, actualizaciones de políticas y un mayor marketing de confianza.
Mira hacia el futuro – lo que las próximas gotas podrían traer
- Navegación de Gemini-in-maps: planificación de rutas en vivo con superposiciones de conversación.
- Proyecto Astra Integration: Asistente de lenguaje visual con análisis de flujo de cámara en tiempo real.
- Agente de investigación profunda: revisiones de literatura automatizada, análisis de mercado, informes competitivos.
- Complementos de Gemini Studio: sin módulos de código para tiendas web, frontends de chat o plataformas de aprendizaje.
- EDGE Intercing Codent: Gemma Repestion para IA en el dispositivo en hardware IoT.
- Soporte de AR inmersivo: ventana de contexto de video en gafas AR, incluida la transcripción en vivo.
Magia de IA mensual: el nuevo ritmo de innovación de Google
Géminis Dots indica un cambio de estrategia: Google ya no se basa únicamente en eventos importantes brillantes como E/S o blogs de productos separados, sino que establece un diálogo continuo de IA. Se crea un ritmo de expectativa clara para los usuarios, los desarrolladores obtienen planificación de seguridad y marketing obtienen una etapa que ofrece nuevas historias cada mes.
Si ya está trabajando con Gemini – ya sea creativo, profesionalmente o simplemente por curiosidad – debe vigilar el calendario de caída. Porque cada mes podría tener una nueva pieza de IA Magic Ready – ya sea un horario diario inteligente, una mini obra maestra de ocho horas de sus propias fotos o un reloj que responde consultas complejas antes de sacar su teléfono inteligente de su bolsillo.
Al final, el mayor progreso puede no ser la función individual, sino la confiabilidad con la que Google redime su promesa de IA – transparente, rítmicamente y con una mirada constante a los beneficios reales en la vida cotidiana.
Adecuado para:
Su transformación de IA, integración de IA y experto en la industria de la plataforma de IA
☑️ Nuestro idioma comercial es inglés o alemán.
☑️ NUEVO: ¡Correspondencia en tu idioma nacional!
Estaré encantado de servirle a usted y a mi equipo como asesor personal.
Puedes ponerte en contacto conmigo rellenando el formulario de contacto o simplemente llámame al +49 89 89 674 804 (Múnich) . Mi dirección de correo electrónico es: wolfenstein ∂ xpert.digital
Estoy deseando que llegue nuestro proyecto conjunto.