英伟达发布Vera芯片:AI代理时代的新算力引擎
当地时间3月28日,英伟达在GTC 2025上正式发布代号“Vera”的全新芯片,专为**智能代理(AI Agent)**工作负载而设计。这一产品标志着英伟达从“训练芯片”向“推理+决策芯片”的战略延伸。OpenAI与SpaceX已确认成为该芯片的首批用户,为Vera的落地提供了标杆场景。
# 面向自主决策的架构革新
不同于传统GPU侧重浮点矩阵运算,Vera芯片引入**“自适应推理引擎”**——一种融合了张量核、稀疏化推理单元与片上内存网络的新架构。其核心创新在于:一是支持**实时多步规划**(multi-step planning),通过硬件加速的链式思考(Chain-of-Thought)推理,将单次推理延迟降至微秒级;二是内置**智能记忆模块**,可动态缓存Agent的上下文状态,避免频繁访问片外HBM,从而将能耗比提升至H100的4.5倍。此外,Vera采用了台积电3nm工艺,晶体管密度达每平方毫米3.2亿个,使其在功耗受限的部署场景(如边缘节点)中同样具备竞争力。
# 双巨头用例:从大模型到星链
OpenAI计划将Vera应用于其新一代**自主编程Agent**,该芯片的并行推理能力可让Agent同时评估数百条代码路径,并实时修正错误。而SpaceX则将Vera部署在星链地面站的**自主故障预测系统**中——利用芯片的低延迟与高可靠性,将卫星姿态数据的分析周期从秒级压缩至毫秒级,从而实现对轨道异常的即时响应。两者需求恰好对应了Agent芯片的两大核心赛道:**复杂决策**与**实时控制**。
# 行业影响
Vera的推出意味着芯片厂商开始为Agent这一新兴计算范式定制硬件。此前,Agent推理主要依赖通用GPU,但存在延迟高、能耗大等问题。英伟达此举不仅巩固了其在AI基础设施的护城河,更可能催生专注于Agent工作负载的生态工具链。随着Vera的量产,2025年下半年或将迎来Agent应用的爆发式增长。