分类 行业快讯 下的文章

以色列研究人员近日发布的一项研究显示,谷歌的 Gemini 助手可能存在重大安全漏洞,攻击者无需高深技术,仅通过隐藏在日常内容中的简单指令,就能利用 Gemini 助手获取敏感数据,甚至远程控制物理设备。

这项名为“只需邀请(Just an Invite)”的新研究表明,基于 Gemini 的助手易遭受所谓的“定向提示软件攻击”。与传统的黑客攻击不同,这类攻击不要求直接访问 AI 模型或具备技术专长,而是将恶意指令隐藏在看似无害的电子邮件、日历邀请或共享文档中。当用户在 Gmail、Google 日历或 Google 助理中寻求 Gemini 帮助时,这些隐藏的指令就会被激活并执行。

该研究团队在演示中展示了这种攻击的严重性。攻击者可以利用修改后的 Gmail 信息或 Google 日历邀请,控制智能家居设备、录制 Zoom 通话,甚至追踪用户位置。通过一些看似无害的词语,如“谢谢”或“太棒了”,研究人员成功地远程关闭了电灯、打开了窗户,甚至启动了家用锅炉。

多重攻击风险,安全漏洞亟待解决

研究人员概述了五种潜在的攻击类型和14种现实场景,这些攻击可能同时危害数字和物理系统。其中包括:

  • 短期上下文中毒:攻击者在短期内通过恶意指令影响 Gemini 的响应。

  • 长期操纵存储数据:利用 Gemini 的数据存储功能,长期操控信息。

  • 利用内部工具:滥用 Gemini 内部工具实现恶意目的。

  • 升级至其他谷歌服务:通过 Gemini 渗透到 Google Home 等其他谷歌服务。

  • 启动第三方应用:在安卓设备上远程启动 Zoom 等第三方应用。

谷歌推出修复措施以应对威胁

研究人员使用 TARA 风险分析框架对这些威胁进行了评估,发现 73% 的威胁属于“高危”类别。这表明这类攻击不仅简单易行,而且后果严重,凸显了加强安全措施的紧迫性。自 GPT-3以来,安全专家就已意识到大型语言模型(LLM)的漏洞,例如简单的“忽略先前指令”提示就能绕过安全防护。该研究进一步证实,即使是当今最先进的 AI 模型,也仍然存在这些漏洞。

谷歌在2025年2月获悉了这些漏洞后,已实施多项安全措施进行修复,包括强制用户确认敏感操作、加强可疑 URL 的检测和过滤,以及使用新的分类器来捕捉间接提示注入。谷歌表示,已在所有 Gemini 应用中启用这些防御措施,并完成了内部测试。

这项研究由特拉维夫大学、以色列理工学院和安全公司 SafeBreach 的团队共同完成。


Augment公司宣布推出其最新的人工智能模型GPT-5,并首次引入了模型选择器功能,允许用户在Claude Sonnet4和GPT-5之间进行选择。这一创新举措标志着Augment在人工智能领域的重大进步,为用户提供了更多的灵活性和选择权。

在过去几周的内部测试中,Augment对两款模型进行了严格的对比测试,涉及单文件编辑、多文件重构、测试生成和大型代码库的错误修复等编码任务。测试结果显示,尽管Claude Sonnet4在速度上略胜一筹,更倾向于快速直接的响应,而GPT-5则在处理复杂任务时表现出更多的谨慎和彻底性,包括更详细的推理和在模糊情况下提出澄清问题。

微信截图_20250808133907.png

在偏好率上,GPT-5以约47%略高于Claude Sonnet4的约44%,但在平局率上两者均为4%。GPT-5在跨文件推理和依赖关系解析方面表现更强,而Claude Sonnet4在处理小型或中型变更时速度更快。在代码质量评论方面,Claude Sonnet4的评论更简洁,专注于主要变更,而GPT-5的评论更全面,包括边缘情况的覆盖。

Augment决定推出模型选择器的原因是为了给用户提供在彻底性和速度之间的选择权。一些用户可能更偏好精确性和边缘情况覆盖,而另一些用户可能更希望快速迭代。此外,如果某个模型提供商遇到延迟或质量波动,用户可以零成本切换模型,这为工作流程提供了额外的弹性。同时,用户的选择行为也为Augment提供了宝贵的反馈,有助于未来的模型优化和行为调整。

尽管Claude Sonnet4仍然是Augment的默认模型,但GPT-5为用户提供了另一种选择,特别是在需要不同方法处理任务时。Augment将继续监控用户在两种模型之间的使用分布、GPT-5采用激增的任务类型以及随时间变化的延迟趋势和失败模式。用户反馈对于塑造下一轮调整至关重要。


近日,《华尔街日报》爆料,百度计划在2025年8月底之前推出一款全新的推理模型,旨在应对日益激烈的市场竞争,尤其是与 DeepSeek 和 Open 等科技巨头的竞争。这款新模型将具备更强的能力,能够处理更加复杂的任务,为用户提供更高效的服务。

此外,百度还将于未来几个月内发布其核心大模型 “文心” 的最新版本 —— 文心5.0。作为百度在人工智能领域的重要产品,文心系列一直以来都备受关注。去年3月,百度发布了被称为 “史上最强” 的文心大模型4.5,表现出色,特别是在多模态理解和文本逻辑推理等方面,测试结果显示其性能优于同类产品 GPT4.5,且 API 调用价格仅为其1%。而文心大模型 X1则在性能上对标 DeepSeek-R1,并具备多模态和多工具调用能力,其 API 调用价格仅为 R1的一半。

2025080814252011810.jpg

这次的新推理模型与文心5.0的推出,表明百度在 AI 领域的持续创新与发展。尽管市场竞争加剧,但百度显然不打算放慢脚步,反而是加速布局,致力于提升产品性能,满足用户日益增长的需求。未来,随着新模型的上线,用户将能够体验到更为智能和高效的 AI 服务。

百度的新产品将进一步巩固其在人工智能领域的领导地位,也将为用户带来更多的便利和可能性。