高盛AI行业研报:市场低估AI需求,预计2030年Token消耗增长24倍

高盛AI行业研报:市场低估AI需求,预计2030年Token消耗增长24倍

核心观点:需求侧被系统性低估

高盛近期发布的AI行业深度研报指出,当前资本市场对AI算力需求的预期普遍偏保守。报告预测,全球AI模型处理的**Token消耗量**将在2030年达到当前水平的24倍,这一数字远超主流分析机构的共识。高盛认为,市场主要关注模型训练端的算力需求,却严重低估了**推理侧**因应用爆发带来的指数级增长。

被忽视的三大需求引擎

**第一,多模态与Agent应用的规模化落地。** 随着GPT-4o、Gemini 2.0等原生多模态模型的成熟,企业级AI应用正从“对话问答”走向“自主任务执行”。单个Agent任务消耗的Token量是简单对话的10-50倍,而全球已有超过2万家企业正在测试AI Agent。高盛估计,到2028年,Agent工作流将贡献超过50%的推理Token消耗。

**第二,成本下降引发“杰文斯悖论”。** 当前AI推理成本正以每年40-50%的速度下降。根据高盛模型,当每百万Token价格降至0.1美元(约为当前Claude 3.5 Sonnet的1/20),大量“高频率、低利润”场景(如实时客服、个性化推荐、代码补全)将全面铺开。历史经验表明,算力效率提升反而会刺激更多需求——正如蒸汽机效率提高导致煤炭消耗总量不降反升。

**第三,边缘与混合部署催生隐性消耗。** 智能手机、PC、汽车等终端的端侧AI将产生海量未被统计的Token。高通等厂商已实现7B模型本地运行,预计2030年超过60%的AI推理将在边缘设备完成,形成“云端+终端”的双重消耗回路。

投资启示与行业影响

高盛特别强调,若Token消耗增长24倍,对应的**AI专用芯片**(如GPU、ASIC)市场规模将从2024年的600亿美元跃升至2030年的3000亿美元以上。同时,**数据中心电力需求**将面临结构性紧张——单次GPT-4响应消耗的电量已是传统网页搜索的10倍,大规模部署需警惕算力基础设施的瓶颈。对于投资者而言,应优先关注推理优化芯片、边缘计算平台及能效管理解决方案的布局机会。

相关文章