2025年8月

据AIbase报道,OpenAI最新款GPT-5模型已正式在Cline平台上线,被誉为OpenAI迄今最先进的大语言模型。GPT-5在推理能力、代码质量和用户体验方面显著提升,成为开发者、企业和研究人员的强大工具。

QQ20250808-152200.png

AIbase指出,GPT-5在Cline平台上展现出卓越的复杂任务处理能力,能高效规划和执行多步骤任务,特别在软件开发中表现优异,超越了Anthropic的Claude4Sonnet。模型整合了此前GPT系列和o系列功能,支持多模态对话,适用于软件开发、科学研究和企业自动化等多种场景。

GPT-5提供多种版本,包括旗舰版、轻量版GPT-5-mini和低延迟版GPT-5-nano,满足不同需求。尽管开发成本超5亿美元,GPT-5仍以更低的错误率和优化的资源分配,为用户提供高效体验。


备受瞩目的GPT-5正式发布,然而这场发布会却呈现出与预期不同的效果。虽然新模型在多个维度实现了改进,但发布过程中出现的技术失误和相对保守的创新幅度,让这次发布显得亮点与争议并存。

OpenAI在此次发布中采用了"All in one"的产品策略,将推理、编程、语音等多种AI能力集成到单一模型中。GPT-5能够根据用户具体需求自动调用相应功能模块,这种智能化的能力分配机制简化了用户的使用流程。

image.png

性能表现方面,GPT-5在多个基准测试中刷新了成绩记录,特别是在编程能力上展现出显著优势。新模型配备了"智能路由"系统,能够快速评估问题复杂度并自动选择最适合的处理模式。文本处理窗口扩展到100万tokens,支持更长文档的处理和分析。

为了提升市场竞争力,OpenAI大幅调整了定价策略。企业用户现在可以根据预算和需求选择GPT-5标准版、mini版和nano版等不同版本,其中mini版的价格甚至低于谷歌Gemini25Flash,显示出OpenAI在价格战中的积极态度。

image.png

商业化导向在发布会中表现明显。OpenAI重点介绍了企业应用案例,展示了GPT-5如何帮助企业构建定制化应用程序。特别值得注意的是专门面向客服场景的GPT-5-chat模型,该版本强调低延迟优势,直接瞄准企业级应用市场。

在实际应用演示中,GPT-5展现出强大的代码生成和优化能力。即使是缺乏编程经验的用户也能通过自然语言描述快速生成功能完整的网站。对于专业开发者而言,GPT-5能够自动分析现有代码并提供优化建议,显著提升开发效率。

image.png

然而,发布会也暴露了一些问题。最引人注意的是演示过程中出现的图表数据错误,这一技术失误在社交媒体上引发了大量讨论。尽管OpenAI声称在减少模型"幻觉"现象方面取得进展,但大语言模型的这一固有问题仍未得到根本解决。

从技术发展角度来看,GPT-5代表了渐进式而非革命性的进步。虽然在多个细分领域实现了性能提升,但距离真正的通用人工智能(AGI)仍有相当距离。这种相对保守的技术进展可能反映出当前AI发展已进入相对稳定的优化阶段。

image.png

发布会整体呈现出的商业化导向也值得关注。从企业案例分享到多版本定价策略,OpenAI显然将重心放在了市场拓展和收入增长上。这种策略转变可能反映出公司在激烈的AI市场竞争中需要更加注重商业化成果。

尽管存在争议,GPT-5的发布仍然推动了AI行业的整体发展。其集成化的功能设计和更具竞争力的定价策略,为用户提供了更多选择,也将促使其他AI公司加快产品迭代和价格调整。

总体而言,GPT-5虽未实现突破性创新,但在功能整合、性能优化和商业化策略方面都展现出积极变化,体现了OpenAI在市场竞争中的务实态度。


近日,有报道揭示苹果正面临一场严峻的AI人才危机,而这场危机的核心并非其语音助手Siri的表现,而是不断被竞争对手挖走的AI领域精英。自今年1月以来,苹果已有约十几名人工智能领域员工被其他科技巨头“挖角”,使其成为硅谷AI人才争夺战中的主要“失血者”。

在过去七个月里,苹果AI团队经历了前所未有的离职潮,多名资深工程师纷纷转投Meta、OpenAI、xAI、Cohere等竞争对手的怀抱。其中,最引人注目的当属苹果基础模型团队负责人Ruoming Pang的离职。上月,他被Meta首席执行官扎克伯格以高达2亿美元的薪酬吸引,正式加入Meta,这一事件无疑给苹果AI团队带来了沉重打击。

除了Ruoming Pang外,苹果AI团队今年还流失了多位关键成员。Brandon McKinzie和Dian Ang Yap选择加入OpenAI,Liutong Zhou则加入了Cohere。同时,Meta也成为了苹果AI人才的主要接收地,Mark Lee、Tom Gunter、Bowen Zhang、Shuang Ma等多名前苹果工程师均已加入Meta。此外,Floris Weers则选择加入了一家保密的初创公司。

苹果智能、AI、iPhone16 (图片来源:官方或第三方截图)

这些离职人员均是苹果人工智能模型研究论文的重要撰稿人,他们的离开对苹果AI团队造成了巨大影响。目前,苹果核心的基础模型团队仅由50至60人组成,每一次人员流失都对公司造成了难以弥补的损失。业内人士指出,这些离职事件反映出苹果在AI领域正面临“信任危机”,在当今科技行业,顶尖AI人才已成为企业竞相争夺的战略资产,其重要性丝毫不亚于知识产权。

在人才流失的困境下,苹果正艰难推进Siri的更新工作,试图整合大语言模型LLMs以提升其性能。然而,去年苹果全球开发者大会上宣传的Apple Intelligence核心功能之一——聊天机器人Siri,至今仍未上线,这无疑让外界对苹果的AI战略产生了质疑。

为了扭转局势,苹果已在苏黎世设立AI办公室,相关团队正在为Siri开发全新的软件架构。这种被称为“单体模型”的新方案将完全基于大型语言模型引擎构建,旨在取代Siri现有的混合系统。多年来,随着不同功能的层层叠加,Siri的现有系统已变得支离破碎,新架构有望让Siri与用户的对话更加顺畅,并在理解和整合信息方面实现大幅提升。

在最近的财报电话会议上,苹果CEO库克表示,由Apple Intelligence驱动的个性化Siri取得了良好进展,并重申相关功能将于明年推出。然而,在AI人才不断流失的背景下,苹果能否如期兑现承诺,仍存在诸多不确定性。


在人工智能技术飞速发展的当下,数据智能已成为企业核心竞争力的关键。然而,随着大模型的“幻觉”问题频出、多模态应用因数据瓶颈受限,以及企业私有知识的利用困境,行业亟需更强大的数据管理系统。为此,同方知网数科正式发布了AIKBase向量数据库管理系统V2.0,旨在为AI提供更聪明的“数据大脑”,重塑智能数据基础设施。

AIKBase V2.0是一款集搜索型与向量型双重优势的多模态数据管理系统,具备国产自主可控、多模数据统一管理、毫秒级向量检索、精准向标融合查询以及分布式集群扩展等五大核心特性,能够全面赋能大模型,助力千行百业实现智能化升级。

微信截图_20250808091037.png

在特性方面,AIKBase V2.0的灵活嵌入能力和兼容多格式的检索引擎使其能够轻松适配任意大模型,为RAG、知识增强等场景打通数据链路。它全面支持鲲鹏、飞腾CPU、统信、麒麟等国产系统,符合国家信创标准,为企业数据安全提供了双重保障。该系统支持各类主流数据库数据迁移,能够将非结构化数据智能“翻译”成向量并统一存入数据仓库,无论是插入新数据还是更新旧数据,都能实现快速操作。此外,AIKBase V2.0的向标融合检索技术允许向量、标量、全文检索自由组合,能够在亿级数据量下实现毫秒级响应,精准理解“语义”。其分布式集群架构则能够轻松扩展,支持大规模数据的弹性架构,确保高性能检索与高可靠服务并存,满足业务增长需求。

在性能测试中,AIKBase V2.0使用开源评测工具ANN-Benchmarks与pgvector、Milvus、ElasticSearch等开源数据库进行了对比测试。结果显示,在90%召回率查询最大吞吐量QPS方面,AIKBase V2.0优于上述开源数据库,同时数据写入吞吐量更高,索引构建耗时更短,展现了其“存得快、找得准、反应快”的优势。

AIKBase V2.0的应用场景广泛,能够为大模型提供私有知识库,帮助其“去幻觉”,让生成结果更准确、更及时。它支持多模态检索,实现文本、图像、视频的秒级语义关联,支持以文搜图、以图搜文等跨模态检索。此外,AIKBase V2.0的混合检索功能结合了向量检索的“语义理解”和全文检索的“精准匹配”,实现了检索结果精度的显著提升。

目前,AIKBase已深度融入知网产品矩阵,为AI增强检索、学术研究助手等核心功能提供强力支撑,多模混合检索让知识获取更智能,毫秒级响应速度让使用体验更高效。


在AI领域激烈的人才争夺战中,OpenAI为防止自家员工被友商挖走,近期祭出了一记重磅举措——宣布了一项极具突破性的员工激励计划。该计划面向公司全体员工,无论是新入职者还是已有一定资历的老员工,都将获得价值高达150万美元(约合人民币1078万元)的奖金。

这笔奖金将分两年发放,发放形式灵活,员工可选择现金或者股票。而且,这一福利覆盖了所有在职及新入职员工,在两年内逐步兑现,基本没有附加条件。OpenAI此举被业界形象地称为应对“扎克伯格挖角效应”的防御策略,意在稳固现有团队,抵御来自Meta等竞争对手的强大挖角攻势。

此前,Meta在人才争夺方面可谓“火力全开”。为了组建所谓的“超级智能”团队,Meta曾向OpenAI的顶尖研究员抛出橄榄枝,开出令人咋舌的条件:最高达1亿美元的个人签约奖金,再加上年薪超过2000万美元的丰厚薪酬包。如此优厚的待遇,无疑给OpenAI带来了巨大的人才流失压力。

面对友商的强势挖角,OpenAI迅速做出反应。Hyperbolic AI CEO就曾略带“傲娇”地表示,英伟达有78%的员工是百万富翁,但如今在OpenAI,这一比例已经达到了百分之百。这一言论虽有些夸张,却也从侧面反映出OpenAI此次激励计划的力度之大。

OpenAI此次推出的150万美元全员奖金计划,不仅成为硅谷史上规模最大的人才保卫战中的高潮一幕,更深刻地揭示了当前AI顶尖人才的稀缺性以及他们在科技行业中的战略价值。在AI技术飞速发展的今天,顶尖人才已成为各大科技公司竞相争夺的核心资源,他们的去留往往决定着公司在这一领域的竞争力和未来发展方向。OpenAI的这一举措,无疑为其他面临类似人才困境的公司提供了一个值得借鉴的榜样。


根据 ARC 奖最新发布的测试结果,主流 AI 模型的性能和成本差异显著。在评估模型一般推理能力的 ARC-AGI-2基准测试中,GPT-5(高级 的得分为9.9%,每项任务成本为0.73美元。而 Grok4(思考型) 的表现略胜一筹,准确率达到16%,但其成本也更高,每项任务需要2至4美元。这表明在复杂的推理任务上,Grok4性能占优,但成本效益远不如 GPT-5。

QQ20250808-092121.png

ARC-AGI 基准上领先语言模型的性能和成本比较。| 图片:ARC-AGI

在要求相对较低的 ARC-AGI-1 测试中,Grok4再次以68% 的准确率领先,略高于 GPT-5的65.7%。尽管 Grok4的准确率更高,但其每项任务约1美元的成本远高于 GPT-5的0.51美元,使得 GPT-5 在此测试中更具性价比。不过,xAI 仍有可能通过价格调整来缩小这一差距。

此外,报告还提到了 GPT-5的轻量级版本。GPT-5Mini 在 AGI-1和 AGI-2上的得分分别为54.3% 和4.4%,成本分别为0.12美元和0.20美元。而更小巧的 GPT-5Nano 在 AGI-1上达到16.5%(0.03美元),在 AGI-2上达到2.5%(0.03美元)。

QQ20250808-092136.png

ARC-AGI-1对 Grok4、GPT-5和较小模型变体的测试结果。| 图片:ARC 奖

值得注意的是,在 ARC-AGI-1测试中,于2024年12月发布的 o3-preview 模型以接近80% 的惊人准确率遥遥领先,但其成本远超其他竞争者。尽管 OpenAI 在其 GPT-5演示中并未提及 ARC 奖,但据 The Information 报道,该公司可能为了适应后续的聊天版本而大幅削减了 o3-preview 的能力。

除了上述基准测试,ARC-AGI-3也在进行中,该测试要求模型在类似游戏的交互环境中通过反复试验来解决任务。尽管人类可以轻松应对,但大多数 AI 代理在视觉益智游戏中仍然面临挑战。


OpenAI 正式发布了其备受期待的 GPT-5 模型,并宣布从即日起对所有用户免费开放。这家由首席执行官 Sam Altman 领导的公司将其誉为“迄今为止最智能、最快、最有用的模型”,称其在数学、科学、金融和法律等领域能提供更加精准的回应。

GPT-5的核心亮点与承诺

在发布会上,Altman 将 GPT-5比作苹果 iPhone 的“视网膜显示屏”,强调其超高的精确度,使用户感觉“像是在与任何主题的专家交谈”。他毫不掩饰地声称,GPT-5是“世界上最好的编码模型”和“写作模型”,在医疗健康等领域同样表现出色。

GPT-5是一款“推理”模型,能够通过迭代方式解决问题,从而得出最终结果。为了支持这一新模型,OpenAI 正在采取果断行动。研究员 Tina Kim 表示,公司将“淘汰所有旧模型”,以确保 GPT-5成为其核心技术。

OpenAI 还声称,GPT-5解决了困扰现有 AI 模型的两大难题:幻觉问题网络安全漏洞。尽管公司表示新模型能更轻松地关联 Google 账户,并对劫持企图具有更强的抵御能力,但《连线》杂志最近的报道显示,ChatGPT 仍存在明显的网络安全漏洞,因此其安全性仍有待实践检验。

ChatGPT  (图片来源:AI合成)

个性化与未来展望

GPT-5提供了四种预设性格选项,包括“愤世嫉俗者”、“机器人”、“倾听者”和“书呆子”,旨在增强模型的可定制性。

尽管 Altman 对 GPT-5充满自信,但他坦承,OpenAI 距离实现其核心目标——通用人工智能(AGI)——还有很长的路要走。他认为 GPT-5只是朝着这个方向迈出的重要一步,并承认目前仍然“缺少一些非常重要的东西”。

此外,OpenAI 最近发布了一项更新,在长时间会话中加入“温和提醒”,鼓励用户休息,以解决用户可能出现的“ChatGPT 精神病”等妄想症问题。

商业与市场动态

就在 GPT-5发布之前,OpenAI 本周早些时候还推出了两款名为“gpt-oss-120b”和“gpt-oss-20b”的“最先进的开放权重语言模型”,但这些模型无疑将被 GPT-5的光芒所掩盖。

作为一家前非营利组织,OpenAI 目前的商业价值正急剧攀升。有消息称,该公司正在洽谈一轮潜在的二级股票发行,估值可能高达 5000亿美元,这使其在 AI 领域的地位愈发稳固。


在2023年的 AI 行业,各大公司都在争夺 “最强模型” 的头衔,而亚马逊云科技(AWS)却选择了一条与众不同的道路。它提出了 “选择大于一切” 的战略,强调在 AI 应用中,适合的模型才是最重要的。为了实现这一目标,亚马逊推出了 Amazon Bedrock 平台,旨在为企业提供一个如同超市般的 AI 模型选择环境。

这个新平台被业内称为 “模型超市”,它汇聚了多种 AI 模型,企业可以根据自身的需求和场景,选择最合适的解决方案。亚马逊意识到,企业需要的不仅仅是最强大的模型,而是能够适应不同场景的多元化模型组合。

最近,OpenAI 的开源模型也正式加入了 Amazon Bedrock,这一合作为平台注入了新的活力。新发布的 gpt-oss-120b 与 gpt-oss-20b 在性能和性价比方面都超越了其他模型,让企业在选择时更具灵活性。此外,Anthropic 的最新模型 Claude Opus4.1与 Claude Sonnet4也在平台上升级,为各种复杂任务提供了全新的解决方案。

image.png

在这种多模型的协作模式下,企业能够实现 “1+1>2” 的效果。在一些复杂的应用场景中,单一模型可能无法满足需求,而通过将多个模型组合使用,则能够最大限度地提升工作效率。例如,在实时翻译系统中,DeepSeek R1和 Claude3.7可以手处理高阶翻译查询,而 Nova Lite 则负责初步翻译。

亚马逊的这一战略展现了它对市场趋势的深刻理解:未来的 AI 市场将不再是单打独斗的 “赢家通吃” 游戏,而是一个开放、多元的生态系统。企业对 AI 模型的需求正在转向最适合的解决方案,而不是单纯追求最强性能。

可以说,亚马逊云科技正在通过 Amazon Bedrock 和 SageMaker 两大平台,打造全球最大的 AI 模型聚合平台,推动着生成式 AI 的应用与发展,帮助企业更好地适应快速变化的商业环境。


特斯拉创始人埃隆·马斯克近日在社交平台公开回应Dojo超级计算机团队解散传闻,明确表示公司将终止同时开发两种不同架构AI芯片的战略。他指出:"分散资源推进Dojo与新一代AI芯片并行开发缺乏效率,特斯拉将集中力量攻关AI5、AI6等后续核心芯片。"

马斯克回应Dojo团队解散:分散资源同时开发两种不同AI芯片无意义

据内部人士透露,此次战略调整涉及重大人事变动。Dojo项目负责人Peter Bannon将于近期离职,其团队成员将转岗至数据中心及计算集群相关岗位。该项目自2019年启动以来,被马斯克视为实现完全自动驾驶(FSD)的关键基础设施,其独特的分布式计算架构曾被寄予厚望。

马斯克在回应中特别强调新一代芯片性能优势:"AI5系列在推理任务中将展现卓越能力,训练性能也可达到行业顶尖水准。"这种表述与此前对Dojo"处理海量视频数据"的定位形成鲜明对比,凸显特斯拉技术路线的根本转变。

行业分析师指出,此次调整反映出特斯拉在AI算力布局上的新思考。相较于专用架构的Dojo,集中资源优化通用型AI芯片更符合当前技术发展趋势


AI初创公司Perplexity正在为美国总统特朗普的社交媒体平台Truth Social提供技术支持,推出全新的AI搜索引擎。

这款名为"Truth Search AI"的搜索引擎已在Truth Social网页版上线,iOS和Android应用的公测版本预计将在"不久的将来"推出。

特朗普媒体在新闻稿中表示,Perplexity的技术能够提供"直接、上下文准确的答案和透明引用",这将帮助Truth Social"指数级增加"用户可获取的信息量。不过,该社交媒体平台仍保留对AI搜索引擎信息来源的控制权。

Truth Social使用的是Perplexity Sonar API,该接口承诺能够查询网络以获取最新和经过验证的信息,即使这些信息来自屏蔽Perplexity爬虫的网站,同时支持结构化输出,允许用户自定义搜索引擎响应的格式。

Perplexity发言人杰西·德怀尔向TechCrunch透露,Sonar API的准确性取决于Truth Social限制的信息源范围。德怀尔表示:"我们对此没有可见性或控制权,就像你在自己公司内部使用API,或者作为学术研究人员想要用它搜索自己的数据一样。"

TechCrunch已联系特朗普媒体了解更多信息,包括Truth Search AI是否能访问整个网络、是否会优先考虑某些信息源,以及AI是否会被指示对总统和现任政府给出有利回应,对民主党人给出不利评价。

为了评估该搜索机器人会引用哪些信息源,Axios向其提出了一系列问题,如"2021年1月6日发生了什么?"和"唐纳德·特朗普为什么被弹劾?"在所有回应中,FoxNews.com要么是最常见的信息源,要么是唯一列出的信息源。其他信息源包括FoxBusiness.com、《华盛顿时报》或《大纪元时报》。

相比之下,Perplexity的公共搜索引擎返回更广泛的信息源,包括维基百科、Reddit、YouTube、NPR和Politico等。

特朗普媒体CEO、前加利福尼亚州国会议员德文·努内斯在声明中表示,Truth Social计划"根据用户反馈完善和扩展搜索功能,同时为平台实施广泛的额外增强功能"。

Perplexity首席商务官德米特里·舍韦连科在声明中也指出,Perplexity的AI提供带有"透明引用的答案,让任何人都能深入挖掘"。

7月下旬,特朗普在发布AI行动计划的同时,颁布了一项针对"有偏见AI"或非"意识形态中立"模型的行政命令。该命令特别将有关种族或性别、无意识偏见、系统性种族主义以及其他归入多元化、公平和包容性范畴的观念称为"普遍且具有破坏性"的意识形态,可能"扭曲输出的质量和准确性"。

Truth Search AI的推出正值OpenAI、Anthropic和谷歌等顶级AI公司被列入获准向联邦民用机构销售服务的供应商名单。OpenAI周三与美国政府中央采购部门达成协议,以每年仅1美元的价格向各机构销售ChatGPT企业版。