英伟达推出专为智能代理设计的全新Vera芯片，OpenAI与SpaceX成为首批用户

2,176 0

英伟达发布Vera芯片：AI代理时代的新算力引擎

当地时间3月28日，英伟达在GTC 2025上正式发布代号“Vera”的全新芯片，专为**智能代理（AI Agent）**工作负载而设计。这一产品标志着英伟达从“训练芯片”向“推理+决策芯片”的战略延伸。OpenAI与SpaceX已确认成为该芯片的首批用户，为Vera的落地提供了标杆场景。

# 面向自主决策的架构革新

不同于传统GPU侧重浮点矩阵运算，Vera芯片引入**“自适应推理引擎”**——一种融合了张量核、稀疏化推理单元与片上内存网络的新架构。其核心创新在于：一是支持**实时多步规划**（multi-step planning），通过硬件加速的链式思考（Chain-of-Thought）推理，将单次推理延迟降至微秒级；二是内置**智能记忆模块**，可动态缓存Agent的上下文状态，避免频繁访问片外HBM，从而将能耗比提升至H100的4.5倍。此外，Vera采用了台积电3nm工艺，晶体管密度达每平方毫米3.2亿个，使其在功耗受限的部署场景（如边缘节点）中同样具备竞争力。

# 双巨头用例：从大模型到星链

OpenAI计划将Vera应用于其新一代**自主编程Agent**，该芯片的并行推理能力可让Agent同时评估数百条代码路径，并实时修正错误。而SpaceX则将Vera部署在星链地面站的**自主故障预测系统**中——利用芯片的低延迟与高可靠性，将卫星姿态数据的分析周期从秒级压缩至毫秒级，从而实现对轨道异常的即时响应。两者需求恰好对应了Agent芯片的两大核心赛道：**复杂决策**与**实时控制**。

# 行业影响

Vera的推出意味着芯片厂商开始为Agent这一新兴计算范式定制硬件。此前，Agent推理主要依赖通用GPU，但存在延迟高、能耗大等问题。英伟达此举不仅巩固了其在AI基础设施的护城河，更可能催生专注于Agent工作负载的生态工具链。随着Vera的量产，2025年下半年或将迎来Agent应用的爆发式增长。