Selección de voz 📢


Google Gemini AI con análisis de videos en vivo y funcionalidad de intercambio de pantalla Mobile World Congress (MWC) 2025

Publicado el: 4 de marzo de 2025 / Actualización del: 4 de marzo de 2025 - Autor: Konrad Wolfenstein

Google Gemini Ki con análisis de videos en vivo y funcionalidad de intercambio de pantalla Mobile World Congress (MWC) 2025

Google Gemini Ki con análisis de videos en vivo y funcionalidad de intercambio de pantalla Mobile World Congress (MWC) 2025-Image: xpert.digital

Interacción multimodal: el futuro del asistente de Google AI

Nuevas funciones de IA: lo que significa Gemini Boost para los usuarios

En el Mobile World Congress (MWC) 2025 en Barcelona, ​​Google presentó extensiones significativas para su asistente de IA Géminis, que debería mejorar la experiencia del usuario a través de nuevas funciones visuales. Las principales renovaciones incluyen análisis de video en vivo y habilidades para compartir pantalla que estarán disponibles para los suscriptores de Google One AI Premium Plan a fines de marzo. Estos desarrollos marcan un hito importante en la estrategia de Google para integrar la inteligencia artificial más profunda en la vida cotidiana y mejorar la interacción multimodal

Adecuado para:

Las nuevas funciones visuales para Géminis

Análisis de video en vivo

Una de las innovaciones sobresalientes presentadas en el MWC 2025 es la función de video en vivo para Gemini. Esta tecnología permite a los usuarios mostrar a la IA en tiempo real lo que captura la cámara de su teléfono inteligente y liderar un diálogo natural. La función fue por primera vez en mayo de 2024 en la conferencia de E/S de Google y ahora está lista para la introducción. En un video de demostración que se muestra en Google, puede ver cómo un alfarero se enfoca en una colección de trabajo de cerámica y le pregunta a Gemini sobre los consejos sobre la selección de color para su próximo jarrón. El asistente de IA analiza los colores existentes y ofrece una recomendación bien fundada para un esmalte adecuado.

Esta función utiliza las habilidades multimodales de Gemini para procesar la información visual en tiempo real e interpretar en el contexto de una conversación natural. Es parte del proyecto más grande de Google, que se conoce como "Proyecto Astra", y representa un progreso significativo en el desarrollo de asistentes de IA que pueden interactuar con el mundo real.

Funcionalidad de intercambio de pantalla

La segunda expansión visual importante es la función de intercambio de pantalla, que permite a los usuarios compartir la pantalla de su teléfono inteligente con Gemini. Al iniciar la interfaz Gemini en Android, aparece un nuevo botón con la inscripción "Share Screen with Live", a través de la cual el usuario puede compartir su pantalla en tiempo real con el Asistente de IA. Esta función se complementa con una nueva notificación en el estilo de una llamada telefónica, que permite una integración perfecta en la interfaz de usuario.

En escenarios prácticos de aplicación, Gemini puede ayudar, por ejemplo, con compras en línea. En un ejemplo de demostración, Google muestra cómo un usuario puede preguntarle a Gemini qué encajaría bien con los jeans que se muestran en la pantalla. Gemini puede dar recomendaciones basadas en lo que ve y acompañar al usuario a través del proceso de compra.

Detalles técnicos y disponibilidad

Horario para la introducción

Google planea lanzar las nuevas funciones de intercambio de videos y pantalla en vivo para los suscriptores avanzados de Gemini en marzo de 2025. Estas funciones se ofrecen como parte del Plan Premium de AI de Google One, que cuesta 21.99 euros por mes. Primero, las extensiones solo estarán disponibles para dispositivos Android, con dispositivos Pixel y Samsung en particular entre los primeros en ser compatibles.

Integración en Géminis en vivo

Las nuevas funciones visuales se integran en Gemini Live, el asistente continuo de IA de Google, que permite conversaciones en tiempo real. Gemini Live se actualizó con Gemini 2.0 Flash, una versión del modelo multimodal que estaba especialmente optimizado para uso rápido y móvil. Curiosamente, el lanzamiento de la pantalla es compatible con una nueva notificación al estilo de una llamada telefónica, que debería permitir una integración perfecta en la experiencia del usuario.

Base tecnológica

Las nuevas funciones se basan en Project Astra, el proyecto de Google para un asistente de IA multimodal universal. El objetivo de este proyecto es desarrollar un asistente que pueda procesar datos de texto, video y audio en tiempo real y guardar en un contexto de conversación de hasta diez minutos. Esta tecnología también debería poder usar la búsqueda, lentes y mapas de Google para ofrecer una experiencia integral de asistente.

Adecuado para:

Géminis en el contexto del mercado asistente de IA

Posición competitiva

Con las nuevas funciones visuales, Google se posiciona estratégicamente contra su principal competidor Openai y su chat. El modo de voz avanzado de CHATGPT ha sido compatible con el intercambio en vivo y de pantalla desde diciembre de 2024. Al integrar estas funciones en Gemini Live, Google asegura que su asistente de IA siga siendo competitivo y ofrece habilidades comparables.

Significado para la industria de los teléfonos inteligentes

La introducción de funciones avanzadas de IA como Géminis que podrían tener un impacto importante en la industria de los teléfonos inteligentes. Después de dos años de cifras de ventas en declive en las que muchos consumidores han mantenido sus dispositivos más tiempo, la integración de los asistentes de IA podría crear nuevos incentivos de compra con habilidades ampliadas. En Alemania, según A Bitkom, solo cada tercio tiene un dispositivo que es menor de un año; en 2023 todavía era del 55 por ciento.

Los fabricantes de teléfonos inteligentes utilizan las nuevas funciones de IA como una característica de diferenciación, ya que los dispositivos son muy similares en el exterior y tecnológicamente. Por ejemplo, Samsung muestra cómo un agente puede hacer tareas en varias aplicaciones en el nuevo teléfono inteligente S25, mientras que OPPO demuestra las habilidades visuales de inteligencia artificial para el procesamiento de imágenes.

Más actualizaciones para Géminis

Soporte de idioma extendido

Además de las funciones visuales, Google también ha ampliado las habilidades lingüísticas de Gemini. El asistente de IA ahora puede entender y hablar en 45 idiomas. Una función particularmente innovadora es la capacidad de cambiar el lenguaje en el medio de la oración sin tener que cambiar la configuración del idioma de su teléfono: "Géminis Live comprenderá y responderá".

Nuevos widgets para usuarios de iPhone

Aunque las funciones visuales inicialmente solo están disponibles para dispositivos Android, Google también ha anunciado actualizaciones para usuarios de iPhone. Con la versión 1.2025.0762303 de la aplicación Gemini, se introducen seis widgets de pantalla de bloqueo diferentes, que permiten un acceso más rápido al asistente de IA. Estos widgets incluyen opciones como "Enter", "Hablar con Gemini Live", "Abra el micrófono", "Use la cámara", "Compartir imagen" y "Archivo compartido". Se pueden colocar tanto en la pantalla de bloqueo como en el centro de control del iPhone, lo que facilita el acceso a Gemini.

Algunos observadores ve este desarrollo como un intento de atraer a los usuarios de iPhone y iPad del asistente de voz de Apple Siri. Según los informes, Apple progresa lentamente en el desarrollo de una versión más poderosa de Siri, que puede competir con las principales plataformas de IA.

Conclusión: significado y perspectiva

Las actualizaciones de Gemini presentadas por Google en el MWC 2025 marcan un paso importante en la evolución de los asistentes de IA. El nuevo análisis de video de las funciones visuales y el intercambio de pantallas, la interacción más intuitiva y relacionada con el contexto entre los usuarios y la inteligencia artificial. Son parte de un desarrollo más amplio hacia asistentes multimodales que pueden interactuar cada vez más con el mundo real.

La integración de estas funciones podría tener efectos de mayor alcance en diferentes áreas. Para la industria de los teléfonos inteligentes, puede crear nuevos incentivos de compra y ayudar a revivir el mercado estancado. Para los usuarios, abren nuevas oportunidades para usar la IA en la vida cotidiana, ya sea al comprar, proyectos creativos o cuando buscan información.

Al mismo tiempo, estos desarrollos ilustran la competencia continua entre las grandes compañías de tecnología en el campo de los asistentes de IA. Google, Openai, Apple y otros trabajan continuamente para mejorar sus asistentes y equiparlos con nuevas funciones. Esto está impulsando la innovación y podría conducir a asistentes de IA aún más potentes e intuitivos en los próximos años.

Con el Proyecto Astra y las nuevas funciones para Gemini, Google muestra su visión a largo plazo para los asistentes de IA: deben ser universales, multimodales y profundos en la vida cotidiana. Las actualizaciones presentadas en el MWC 2025 son un paso importante de esta manera y dan una idea del futuro de la interacción humana-máquina.

Adecuado para:

 

Su socio global de marketing y desarrollo empresarial

☑️ Nuestro idioma comercial es inglés o alemán.

☑️ NUEVO: ¡Correspondencia en tu idioma nacional!

 

Pionero digital - Konrad Wolfenstein

Konrad Wolfenstein

Estaré encantado de servirle a usted y a mi equipo como asesor personal.

Puedes ponerte en contacto conmigo rellenando el formulario de contacto o simplemente llámame al +49 89 89 674 804 (Múnich) . Mi dirección de correo electrónico es: wolfenstein xpert.digital

Estoy deseando que llegue nuestro proyecto conjunto.

 

 

☑️ Apoyo a las PYMES en estrategia, consultoría, planificación e implementación.

☑️ Creación o realineamiento de la estrategia digital y digitalización

☑️ Ampliación y optimización de procesos de ventas internacionales

☑️ Plataformas comerciales B2B globales y digitales

☑️ Pionero en desarrollo empresarial / marketing / relaciones públicas / ferias comerciales


⭐️ Inteligencia artificial (IA): blog de IA, punto de acceso y centro de contenido ⭐️ Inteligencia digital ⭐️ Prensa - Trabajo de prensa experta | Asesoramiento y oferta ⭐️ XPaper