毕马威报告：全球仅26%企业完全掌控AI成本，代币计费致预算飙升

# 毕马威报告：成本失控警钟敲响，代币计费成企业AI预算“黑洞”

近日，毕马威（KPMG）发布最新调研报告，揭示了一个令人警醒的现状：全球仅有26%的企业能够完全掌控其人工智能（AI）项目的成本。这一数据背后，是AI部署从实验阶段迈向规模化生产时，财务治理能力与技术创新速度之间的严重脱节。报告特别指出，“代币计费”（Token-based Billing）模式正成为导致企业AI预算飙升的核心推手。

## 代币计费：从“按需使用”到“意外账单”

传统IT基础设施通常采用按实例时长或固定订阅计费，成本相对可预测。然而，大语言模型（LLM）的“代币计费”模式颠覆了这一逻辑。每个API调用、每次对话生成都会消耗代币，而代币数量不仅与输入输出长度相关，更与模型复杂度、上下文窗口、系统提示词等高度耦合。企业往往在开发测试阶段仅使用少量代币，一旦进入生产环境并处理真实用户请求，代币消耗量可能呈指数级增长。

毕马威报告显示，超过六成受访企业表示，AI项目的实际月度费用超出预算30%以上，且难以在事前完成准确预估。原因在于，缺乏成熟的成本可视化工具，导致财务部门与AI工程团队之间形成信息孤岛——工程师关注模型效果，而财务只看到月底飙升的账单。

## 成本失控的深层症结：治理缺位与模型选择失当

除了计费模式本身，报告还指出企业成本管理薄弱的三大结构性原因：其一，组织层面缺少明确的AI成本分摊机制，多部门共用模型时，费用归属模糊，形成“公地悲剧”；其二，盲目追求顶级模型（如GPT-4）而忽视任务实际所需，导致大量代币浪费在非关键推理上；其三，缺乏动态资源调度策略，如未设置代币预算上限、未启用缓存机制或未将高负载任务迁移至更高效的专用模型。

## 破局之道：从“被动买单”到“主动治理”

报告建议企业从三方面入手。首先，推动财务与工程团队共建“成本运营中心”，对代币消耗进行实时监控与预算预警。其次，采用模型路由策略，根据任务复杂度动态选择合适体量的模型（如用“Gemini Flash”替代“Pro”进行简单分类）。最后，引入代币预算“硬约束”，通过配额管理倒逼业务方优化提示词设计，减少无效输出。

随着AI支出在IT预算中的占比持续提升（毕马威估计2025年将超过15%），能否有效控制AI成本，将直接决定企业能否在AI竞争中实现可持续的ROI。仅有26%的掌控率，既是警钟，也是机遇——率先建立成本治理体系的企业，将占据下一阶段的先发优势。