芯片:高德FantasyWorld一经发布就登顶世界模型榜首,阿里空间智能再下一城!,影响深远

AI资讯1个月前发布 全启星小编
1,320 0

阿里巴巴旗下高德地图正式推出自研世界模型FantasyWorld,凭借海量真实导航数据优势,这一模型迅速在国际权威基准WorldScore Leaderboard上夺得综合得分第一,进一步扩展了阿里在AI基础模型领域的布局。FantasyWorld聚焦于高品质3D世界构建,正成为具身智能和自动驾驶领域的新焦点。 FantasyWorld的核心技术突破FantasyWorld旨在为具身智能与通用AIAGI提供高质量3D世界模型。其创新在于:在冻结的视频基础模型骨干上,增设可训练的几何分支,实现视频潜变量和隐式3D场的联合建模,仅需一次前向计算即可完成。这一设计显著提升了生成视频的视觉真实感,同时大幅改善多视角一致性和几何保真度。相比近期其他几何一致性方法,FantasyWorld在多视角协同、风格一致性以及极端视角如180旋转下的物体形状与纹理保持上表现出色。模型生成的3D潜变量可直接解码为深度图或点云,支持下游任务无需额外优化。 登顶WorldScore:国际认可的实力证明WorldScore是由斯坦福大学李飞飞团队主导的统一世界生成基准,涵盖静态动态场景、可控性、一致性等多维度评估。目前,FantasyWorld在综合得分以及关键指标如静态世界得分7855、动态世界得分6689上位居榜首,超越多家国内外竞争模型。相关论文已被ICLR2025、NeurIPS2025等顶会收录,高德方面表示模型将于近期开源,进一步推动学术与产业合作。 实际应用落地:飞行街景引领空间智能新体验FantasyWorld已率先应用于高德地图的飞行街景功能。商家仅需上传几段手机视频,即可免费生成高保真3D虚拟漫游街景,帮助用户提前身临其境了解餐厅布局、座位区等细节,同时助力线下商家提升流量。这一功能被视为技术平权的体现,降低了专业3D建模门槛。高德还内部成立了具身业务部,探索机器人、机器狗等方向,结合空间智能全面转向物理AI。 行业影响:世界模型时代加速到来随着自动驾驶转向端到端视觉语言行动VLA方案,以及具身智能的迅猛发展,追求物理真实性和3D一致性的世界模型正变得至关重要。FantasyWorld的推出,不仅强化了阿里在多模态AI的版图,还凸显了中国企业在真实世界数据驱动下的空间智能优势。AIbase观点:FantasyWorld标志着世界模型从视频生成向可交互3D模拟的跃进,将深刻影响ARVR、机器人导航、数字孪生等领域的未来。高德凭借亿级用户数据积累,或将在物理AI赛道占据先机。AIbase将持续关注其开源进展与更多应用落地,为读者带来深度解读。。

相关文章