毕马威报告:全球仅26%企业完全掌控AI成本,代币计费致预算飙升

# 毕马威报告:成本失控警钟敲响,代币计费成企业AI预算“黑洞”

近日,毕马威(KPMG)发布最新调研报告,揭示了一个令人警醒的现状:全球仅有26%的企业能够完全掌控其人工智能(AI)项目的成本。这一数据背后,是AI部署从实验阶段迈向规模化生产时,财务治理能力与技术创新速度之间的严重脱节。报告特别指出,“代币计费”(Token-based Billing)模式正成为导致企业AI预算飙升的核心推手。

## 代币计费:从“按需使用”到“意外账单”

传统IT基础设施通常采用按实例时长或固定订阅计费,成本相对可预测。然而,大语言模型(LLM)的“代币计费”模式颠覆了这一逻辑。每个API调用、每次对话生成都会消耗代币,而代币数量不仅与输入输出长度相关,更与模型复杂度、上下文窗口、系统提示词等高度耦合。企业往往在开发测试阶段仅使用少量代币,一旦进入生产环境并处理真实用户请求,代币消耗量可能呈指数级增长。

毕马威报告显示,超过六成受访企业表示,AI项目的实际月度费用超出预算30%以上,且难以在事前完成准确预估。原因在于,缺乏成熟的成本可视化工具,导致财务部门与AI工程团队之间形成信息孤岛——工程师关注模型效果,而财务只看到月底飙升的账单。

## 成本失控的深层症结:治理缺位与模型选择失当

除了计费模式本身,报告还指出企业成本管理薄弱的三大结构性原因:其一,组织层面缺少明确的AI成本分摊机制,多部门共用模型时,费用归属模糊,形成“公地悲剧”;其二,盲目追求顶级模型(如GPT-4)而忽视任务实际所需,导致大量代币浪费在非关键推理上;其三,缺乏动态资源调度策略,如未设置代币预算上限、未启用缓存机制或未将高负载任务迁移至更高效的专用模型。

## 破局之道:从“被动买单”到“主动治理”

报告建议企业从三方面入手。首先,推动财务与工程团队共建“成本运营中心”,对代币消耗进行实时监控与预算预警。其次,采用模型路由策略,根据任务复杂度动态选择合适体量的模型(如用“Gemini Flash”替代“Pro”进行简单分类)。最后,引入代币预算“硬约束”,通过配额管理倒逼业务方优化提示词设计,减少无效输出。

随着AI支出在IT预算中的占比持续提升(毕马威估计2025年将超过15%),能否有效控制AI成本,将直接决定企业能否在AI竞争中实现可持续的ROI。仅有26%的掌控率,既是警钟,也是机遇——率先建立成本治理体系的企业,将占据下一阶段的先发优势。

相关文章