英伟达震撼推出 Vera CPU,为 Agentic AI 时代谱写新篇章

英伟达震撼推出 Vera CPU,为 Agentic AI 时代谱写新篇章

一、从 GPU 霸主到 CPU 新星:Vera 的登场背景

在 2025 年 GTC 大会上,英伟达正式揭晓了其自研高性能 CPU——Vera,标志着这家 GPU 巨头在计算架构领域的又一次战略跃迁。Vera 并非传统意义上的通用处理器,而是专为 **Agentic AI(自主智能体 AI)** 工作负载深度优化的异构计算核心。随着 AI 从“被动响应”走向“主动规划与执行”,智能体需要同时处理复杂推理、多模态感知、长程记忆和实时决策,这对 CPU 的标量计算、内存带宽和 I/O 一致性提出了前所未有的挑战。英伟达表示,Vera 正是为填补这一空白而生。

二、架构革新:为智能体量身定制的计算基座

Vera CPU 基于全新的 **“Vera Core”微架构**,在单芯片内集成了 72 个高性能核心,并采用 **3D 堆叠技术** 将 512MB L3 缓存和 HBM4 内存控制器直接整合。与英伟达 Hopper 及后续 Blackwell GPU 通过 NVLink-C2C 实现 **缓存一致互联**,使得 CPU 与 GPU 共享统一虚拟地址空间。这一设计的关键意义在于:当 AI 智能体需要执行“思考→行动→验证”循环时,Vera 负责处理控制流、逻辑推理和工具调用编排,而 GPU 并行计算则专注于大规模模型推理和模拟计算,两者间的数据传输延迟可从微秒级降至纳秒级。

此外,Vera 内置了专用的 **“智能体加速单元”**,可硬化解码类 Transformer 注意力机制中的键值缓存查找与软更新操作,将智能体常见的长上下文管理效率提升 4 倍以上。英伟达官方数据显示,在典型的多步骤工具使用基准测试中(如 SWE-bench 和 Agentic Tasks),基于 Vera+Blackwell 的系统相比上一代 Grace Hopper 组合,端到端吞吐量提升了 2.8 倍,同时功耗仅增加 15%。

三、重塑 AI 基础设施:从训练中心到决策边缘

Vera 的推出不仅关乎性能,更体现了英伟达对 **“AI 计算机”** 整体架构的顶层设计。在 Agentic AI 时代,智能体需要部署在从云端到边缘的各类场景中——自动驾驶汽车的实时路径规划、机器人柔性制造中的动态任务调度、金融量化交易中的多智能体博弈——这些场景对 CPU 的确定性延迟和可靠性要求远超传统通用计算。Vera 通过集成 **硬件可信执行环境(TEE)** 和 **确定性调度引擎**,使得关键智能体任务能以微秒级的抖动完成上下文切换,为工业级自主决策提供了安全与实时性双重保障。

从行业影响看,Vera 有望打破长期以来 CPU 与 GPU 在 AI 工作负载中的“主从关系”。以往 CPU 只是“驱动 GPU”的角色,而 Vera 让 CPU 成为智能体系统的 **“中央指挥节点”**,GPU 则作为“专用加速器”。这一转变将推动整个 AI 硬件生态重新定义 CPU 在数据中心中的价值——不是替代 x86,而是与 GPU 深度融合,形成更高效、更智能的混合计算范式。随着英伟达将 Vera 集成到其 DGX 及 GB200 平台中,2025 年或将成为 **“Agentic AI 硬件元年”**,而 Vera 正是为这个新篇章写下的第一行代码。

相关文章