网站图标 专家数码

Google Gemini Ki与实时视频分析和屏幕共享功能 - 摩托车世界大会(MWC)2025

Google Gemini Ki与实时视频分析和屏幕共享功能 - 摩托车世界大会(MWC)2025

谷歌 Gemini AI 具备实时视频分析和屏幕共享功能——2025 年世界移动通信大会 (MWC)——图片来源:Xpert.Digital

多模态交互:谷歌人工智能助手的未来

全新人工智能功能:Gemini Boost 对用户意味着什么

在巴塞罗那举行的2025年世界移动通信大会(MWC)上,谷歌发布了其人工智能助手Gemini的重大升级,旨在通过全新的视觉功能提升用户体验。主要新增功能包括实时视频分析和屏幕共享,这些功能将于3月底面向Google One AI高级订阅用户开放。这些进展标志着谷歌在将人工智能更深入地融入日常生活、改善多模态交互方面

适合:

双子座的新视觉特性

实时视频分析

在2025年世界移动通信大会(MWC 2025)上,谷歌发布的一项引人注目的创新是Gemini的实时视频功能。这项技术允许用户实时向人工智能展示智能手机摄像头拍摄的画面,并与之进行自然的对话。该功能最早在2024年5月的谷歌I/O开发者大会上亮相,如今已准备就绪,即将正式发布。在谷歌展示的演示视频中,一位陶艺家将摄像头对准一系列陶瓷作品,并向Gemini咨询如何为她的下一个花瓶选择颜色。人工智能助手分析了可用的颜色,并就合适的釉料给出了专业的建议。

这项功能利用 Gemini 的多模态处理能力,实时处理视觉信息,并将其融入自然对话的语境中。它是谷歌名为“Project Astra”的大型项目的一部分,代表着人工智能助手在与现实世界互动方面取得的重大进展。

屏幕共享功能

第二个重要的视觉增强功能是屏幕共享功能,它允许用户将智能手机屏幕共享给 Gemini。在 Android 系统上启动 Gemini 界面时,会出现一个名为“实时共享屏幕”的新按钮,使用户能够与 AI 助手实时共享屏幕。此外,该功能还配有类似来电通知的新通知,从而与用户界面无缝集成。

在实际应用场景中,Gemini 可以利用这项功能辅助用户进行网上购物。例如,谷歌演示了用户如何向 Gemini 询问屏幕上显示的牛仔裤应该搭配什么服饰。Gemini 会根据屏幕上的信息给出建议,并引导用户完成购物流程。

技术细节和供货情况

引言时间表

谷歌计划最早于 2025 年 3 月向 Gemini Advanced 订阅用户推出全新的实时视频和屏幕共享功能。这些功能将包含在每月 21.99 欧元的 Google One AI Premium 套餐中。初期,这些增强功能仅适用于安卓设备,Pixel 和三星设备将率先获得支持。

Gemini Live 集成

这些全新的视觉功能已集成到谷歌的实时AI助手Gemini Live中,该助手支持实时对话。Gemini Live已更新至Gemini 2.0 Flash版本,这是一个专为快速移动使用而优化的多模态模型版本。值得一提的是,屏幕共享功能通过类似电话通知的新样式实现,从而与用户体验无缝衔接。

技术基础

这些新功能基于谷歌的“Project Astra”项目,该项目旨在打造一款通用、多模态人工智能助手。该项目的目标是开发一款能够实时处理文本、视频和音频数据,并将其存储在长达十分钟的对话上下文中的助手。这项技术还旨在利用谷歌搜索、Lens 和地图,提供全面的助手体验。

适合:

Gemini 在人工智能助手市场中的地位

竞争定位

凭借这些全新的视觉功能,谷歌正从战略上布局,以对抗其主要竞争对手 OpenAI 及其 ChatGPT。ChatGPT 的高级语音模式自 2024 年 12 月起就支持实时和屏幕共享。通过将这些功能集成到 Gemini Live 中,谷歌确保其 AI 助手保持竞争力,并提供与之匹敌的功能。

对智能手机行业的重要性

引入像Gemini提供的这类先进人工智能功能,可能会对智能手机行业产生重大影响。在经历了两年销量下滑(期间许多消费者延长了手机的使用寿命)之后,集成功能更强大的人工智能助手可能会带来新的购买动力。德国电信协会(Bitkom)的一项调查显示,目前只有三分之一的人拥有使用不到一年的手机——这一比例低于2023年的55%。

由于智能手机在外观和技术上非常相似,制造商们正利用人工智能的新功能来打造差异化优势。例如,三星正在展示其新款S25智能手机上的智能助手如何跨多个应用程序执行任务,而OPPO则在展示人工智能在图像处理方面的视觉能力。

双子座的更多更新

增强的语言支持

除了视觉功能外,谷歌还扩展了Gemini的语言能力。这款人工智能助手现在可以理解并用45种语言进行交流。其中一项特别创新的功能是,它能够在用户说话过程中自动切换语言,而无需用户更改手机的语言设置——“Gemini Live将理解并做出回应。”

iPhone 用户的新小部件

虽然这些视觉功能最初仅适用于安卓设备,但谷歌也宣布了针对 iPhone 用户的更新。Gemini 应用的 1.2025.0762303 版本新增了六款不同的锁屏小部件,让用户能够更快地访问人工智能助手。这些小部件包括“输入提示”、“与 Gemini 实时对话”、“打开麦克风”、“使用相机”、“分享图像”和“分享文件”等选项。它们可以放置在锁屏界面和 iPhone 的控制中心,方便用户快速访问 Gemini。

一些观察人士将此举解读为苹果试图将iPhone和iPad用户从其语音助手Siri吸引过来。有报道指出,苹果在开发功能更强大的Siri版本方面进展缓慢,该版本旨在与领先的人工智能平台竞争。

结论:意义与展望

谷歌在2025年世界移动通信大会(MWC 2025)上发布的Gemini更新标志着人工智能助手发展历程中的一个重要里程碑。新增的视觉功能——实时视频分析和屏幕共享——实现了用户与人工智能之间更加直观、更具情境感知的交互。这些更新是向多模态助手发展更广泛进程的一部分,这些助手能够越来越多地与现实世界互动。

这些功能的整合可能会对各个领域产生深远的影响。对于智能手机行业而言,它们可以创造新的购买动力,并有助于重振低迷的市场。对于用户而言,它们开辟了在日常生活中使用人工智能的新途径,无论是购物、创意项目还是信息搜索。

与此同时,这些进展也凸显了各大科技公司在人工智能助手领域持续不断的竞争。谷歌、OpenAI、苹果等公司都在不断改进其助手并为其添加新功能。这推动了创新,并可能在未来几年催生出更强大、更直观的人工智能助手。

通过“Astra”项目和“Gemini”的新功能,谷歌展示了其对人工智能助手的长期愿景:它们应该是通用的、多模态的,并深度融入日常生活。在2025年世界移动通信大会(MWC 2025)上发布的这些更新是朝着这个方向迈出的重要一步,也让我们得以一窥未来人机交互的面貌。

适合:

 

您的全球营销和业务发展合作伙伴

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

Konrad Wolfenstein

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 创建或调整数字战略和数字化

☑️国际销售流程的扩展和优化

☑️ 全球数字 B2B 交易平台

☑️ 先锋业务发展/营销/公关/贸易展览会

退出手机版