李飞飞团队在空间智能(Spatial Intelligence)领域的研究自2024年起取得了一系列突破性进展,其里程碑成果可归纳为以下核心方向:
一、理论框架提出与定义(2024年)
1、空间智能概念系统化
a.定义: 李飞飞首次明确空间智能为“机器在3D空间和时间中感知、推理和行动的能力”,强调其是超越语言智能的AI核心能力,对实现AGI至关重要。
理论意义: 提出空间智能是AI理解物理世界的底层基础,与语言模型形成互补——语言处理符号序列,空间智能处理几何、物理与动态交互。
二、关键技术突破(2024–2025年)
1、单图生成3D世界模型(2024年12月)
技术内容: World Labs发布首个空间智能模型,仅需单张2D图像即可生成高保真、可交互的3D场景,突破传统NeRF技术对多视角输入的依赖。
应用场景: 影视制作、游戏开发、建筑设计及AR/VR,大幅降低3D内容生成成本。
2、空间智能评估工具VSI-Bench(2025年4月)
设计细节: 基于288个真实场景视频构建超5000个问答对,覆盖居住、工业等多场景,测试任务包括空间布局推理、距离估算、动态预测等。
关键发现: Gemini-