挑战英伟达？OpenAI携手芯片新锐Cerebras，开启低延迟推理新时代

3,245 0

挑战英伟达？OpenAI携手芯片新锐Cerebras，开启低延迟推理新时代近日，OpenAI宣布与美国芯片初创公司Cerebras Systems达成战略合作，共同推进大模型在低延迟推理场景下的性能突破。此举被视为对英伟达长期主导的GPU生态体系发起的一次有力挑战。作为近年来迅速崛起的高性能计算新势力，Cerebras凭借其自研的WSE（Wafer-Scale Engine）芯片，在单片芯片集成高达2.6万亿个晶体管，远超传统GPU，实现超大规模并行计算能力。此次合作聚焦于优化大模型推理效率，尤其针对实时对话、生成式AI应用等对响应速度要求极高的场景。分析指出，尽管英伟达凭借CUDA生态和成熟的软硬件协同优势占据市场主导地位，但其高功耗、高成本及供应链依赖问题逐渐显现。而Cerebras通过专用架构设计，显著降低模型推理延迟，并在特定任务中展现出更高的能效比。此次与OpenAI的合作，不仅为大模型部署提供了新的硬件选择，更可能推动行业从“算力堆叠”向“效率优先”的范式转变。值得注意的是，该合作尚处于早期阶段，实际落地效果仍需验证。但长远来看，若能持续突破性能瓶颈，将有望重塑人工智能基础设施格局，加速生成式AI从实验室走向规模化商用。