# 复旦系团队首创“时空一体世界动作模型”:技术突破与资本双重加持
近期,一支来自复旦系的AI创业团队引发了业界广泛关注——其首创的“时空一体世界动作模型”(Spatio-Temporal Unified World Action Model,简称STU-WAM)在短短半年内连续斩获5轮融资,累计金额数亿元人民币。这一现象不仅折射出资本市场对具身智能与通用世界模型赛道的强烈信心,更揭示了该团队在技术路径上的独特突破。
**技术内核:从“感知”到“行动”的统一范式**
传统的机器人或数字人动作生成往往割裂处理空间信息(如物体位置、环境几何)与时间信息(如动作序列、物理规律),导致动作在复杂动态场景中缺乏连贯性与合理性。STU-WAM的核心创新在于将时空建模与因果推理深度融合——模型不仅能实时感知三维空间的静态结构,还能动态预测物体在时间轴上的物理变化(如碰撞、滑落、形变),并直接输出可执行的动作指令。这一“时空一体”架构使得智能体在非结构化环境中(如家庭、手术台、工业流水线)实现了从“观察-推理-行动”的闭环,显著降低了训练数据需求,同时提升了泛化能力。
**市场逻辑:具身智能的“操作系统”级机会**
半年内5轮融资的背后,是资本对该技术定位的认可。与大多聚焦于语言或多模态感知的模型不同,STU-WAM直指“世界模型”中难度最高的动作生成层——这被视为具身智能落地的“最后一块拼图”。投资方包括多家头部硬科技基金与产业资本,其关注点不仅在于模型在仿真环境中的优异表现,更在于其与下游场景的结合潜力:从人形机器人运动控制、自动驾驶复杂决策,到虚拟数字人的高自由度交互,STU-WAM有望成为底层动作生成的标准组件。
**挑战与展望:技术落地仍需跨越“仿真-现实”鸿沟**
尽管融资势头强劲,团队仍需解决两大核心问题:一是真实物理世界的噪声与延迟对模型在线推理时延的苛刻要求;二是大规模高质量时空动作数据的稀缺性。目前该团队正通过自研的高效数据引擎与分布式训练框架,尝试将模型压缩至边缘端,并计划于年内推出首款面向工业协作机器人的SDK。若成功,这或将成为中国团队在全球具身智能领域从“跟随”转向“引领”的关键一步。