高盛AI行业研报：市场低估AI需求，预计2030年Token消耗增长24倍

核心观点：需求侧被系统性低估

高盛近期发布的AI行业深度研报指出，当前资本市场对AI算力需求的预期普遍偏保守。报告预测，全球AI模型处理的**Token消耗量**将在2030年达到当前水平的24倍，这一数字远超主流分析机构的共识。高盛认为，市场主要关注模型训练端的算力需求，却严重低估了**推理侧**因应用爆发带来的指数级增长。

被忽视的三大需求引擎

**第一，多模态与Agent应用的规模化落地。** 随着GPT-4o、Gemini 2.0等原生多模态模型的成熟，企业级AI应用正从“对话问答”走向“自主任务执行”。单个Agent任务消耗的Token量是简单对话的10-50倍，而全球已有超过2万家企业正在测试AI Agent。高盛估计，到2028年，Agent工作流将贡献超过50%的推理Token消耗。

**第二，成本下降引发“杰文斯悖论”。** 当前AI推理成本正以每年40-50%的速度下降。根据高盛模型，当每百万Token价格降至0.1美元（约为当前Claude 3.5 Sonnet的1/20），大量“高频率、低利润”场景（如实时客服、个性化推荐、代码补全）将全面铺开。历史经验表明，算力效率提升反而会刺激更多需求——正如蒸汽机效率提高导致煤炭消耗总量不降反升。

**第三，边缘与混合部署催生隐性消耗。** 智能手机、PC、汽车等终端的端侧AI将产生海量未被统计的Token。高通等厂商已实现7B模型本地运行，预计2030年超过60%的AI推理将在边缘设备完成，形成“云端+终端”的双重消耗回路。

投资启示与行业影响

高盛特别强调，若Token消耗增长24倍，对应的**AI专用芯片**（如GPU、ASIC）市场规模将从2024年的600亿美元跃升至2030年的3000亿美元以上。同时，**数据中心电力需求**将面临结构性紧张——单次GPT-4响应消耗的电量已是传统网页搜索的10倍，大规模部署需警惕算力基础设施的瓶颈。对于投资者而言，应优先关注推理优化芯片、边缘计算平台及能效管理解决方案的布局机会。