OpenAI联合硬件巨头推出MRC协议，旨在消除GPU闲置浪费

OpenAI联合硬件巨头推出MRC协议：重塑GPU资源利用效率的新范式

事件背景

近日，OpenAI联合NVIDIA、AMD、Intel等多家硬件巨头正式发布了一项名为MRC（Multi-Rate Compute，多速率计算）的开放协议。该协议旨在解决当前AI算力基础设施中普遍存在的GPU闲置浪费问题——据行业调研数据显示，全球数据中心GPU的平均利用率仅维持在30%-50%之间，大量算力资源在模型推理间歇、训练任务切换或负载波动时段处于空转状态。MRC协议的推出，标志着业界首次从底层硬件协议层面系统性应对这一挑战。

协议核心机制

MRC协议的核心思路在于实现**GPU资源的动态细粒度切分与跨任务调度**。传统模式下，GPU通常以“物理独占”方式分配给单一任务，即便任务仅需部分算力，剩余资源也无法被其他进程利用。MRC通过引入硬件级的分时复用与算力池化机制，允许同一GPU同时承载多个不同优先级的计算任务，并根据任务的实际需求动态调整分配给每个任务的算力比例。具体而言，协议定义了三种基本速率模式：**持续计算模式**（高优先级推理任务）、**弹性共享模式**（低优先级训练任务）以及**空闲回收模式**（系统级后台任务）。硬件厂商可通过固件升级或驱动更新实现对MRC的支持，而无需修改现有GPU的物理架构。

行业影响与挑战

从产业角度看，MRC协议有望将全球GPU平均利用率提升至70%以上，相当于在不增加硬件采购的前提下释放数百万张等效GPU的算力。这对于正在经历“算力荒”的AI行业而言意义重大——尤其对中小型企业和研究机构，他们可通过租赁或共享方式获取原本难以负担的高端算力。然而，协议的实际落地仍面临两大挑战：一是**任务隔离与安全性**，多任务共享物理GPU可能引发数据泄露或性能干扰风险；二是**生态适配成本**，主流AI框架（如PyTorch、TensorFlow）需调整其调度器以感知MRC协议，这需要OpenAI与社区紧密协作。

未来展望

MRC协议目前已进入公开征求意见阶段，预计首个支持该协议的硬件产品将在2025年下半年面世。若该协议能被广泛采纳，它不仅会改变云服务商的定价模式（从按GPU卡计费转向按实际算力消耗计费），更可能催生一个全新的“算力期货”市场，使GPU资源像电力一样按需调配。OpenAI此举展现了其在推动AI基础设施标准化方面的战略野心，而硬件巨头们的集体参与则表明，行业共识正在从“堆算力”转向“用算力”。