空间智能-李飞飞团队工作总结（至2025.07）

空间智能-李飞飞团队工作总结（至2025.07）

pingmian/2025/7/15 9:11:48/文章来源:https://blog.csdn.net/qq_34919792/article/details/149341735

李飞飞团队在空间智能（Spatial Intelligence）领域的研究自2024年起取得了一系列突破性进展，其里程碑成果可归纳为以下核心方向：

一、理论框架提出与定义（2024年）

1、空间智能概念系统化

a.定义： 李飞飞首次明确空间智能为“机器在3D空间和时间中感知、推理和行动的能力”，强调其是超越语言智能的AI核心能力，对实现AGI至关重要。
理论意义： 提出空间智能是AI理解物理世界的底层基础，与语言模型形成互补——语言处理符号序列，空间智能处理几何、物理与动态交互。

二、关键技术突破（2024–2025年）

1、单图生成3D世界模型（2024年12月）

技术内容： World Labs发布首个空间智能模型，仅需单张2D图像即可生成高保真、可交互的3D场景，突破传统NeRF技术对多视角输入的依赖。
应用场景： 影视制作、游戏开发、建筑设计及AR/VR，大幅降低3D内容生成成本。

2、空间智能评估工具VSI-Bench（2025年4月）

设计细节： 基于288个真实场景视频构建超5000个问答对，覆盖居住、工业等多场景，测试任务包括空间布局推理、距离估算、动态预测等。
关键发现： Gemini-

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/88801.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/88801.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【算法深练】BFS：“由近及远”的遍历艺术，广度优先算法题型全解析

【算法深练】BFS：“由近及远”的遍历艺术，广度优先算法题型全解析

前言宽度优先遍历BFS与深度优先遍历DFS有本质上的区别，DFS是一直扩到低之后找返回，而BFS是一层层的扩展就像剥洋葱皮一样。通常BFS是将所有路径同时进行尝试，所以BFS找到的第一个满足条件的位置，一定是路径最短的位置&#xf…

阅读更多...

ZW3D 二次开发-创建球体

ZW3D 二次开发-创建球体

使用中望3d用户函数 cvxPartSphere 创建球体函数定义： ZW_API_C evxErrors cvxPartSphere(svxSphereData *Sphere, int *idShape); typedef struct svxSphereData {evxBoolType Combine; /**<@brief combination method */svxPoint Center; /**<@brief sphere ce…

阅读更多...

艺术总监的构图“再造术”：用PS生成式AI，重塑照片叙事框架

艺术总监的构图“再造术”：用PS生成式AI，重塑照片叙事框架

在视觉叙事中，我们常常面临一个核心的“对立统一”：一方面是**“被捕捉的瞬间”（The Captured Moment），即摄影师在特定时间、特定地点所记录下的客观现实；另一方面是“被期望的叙事”**（The Des…

阅读更多...

ChatGPT无法登陆？分步排查指南与解决方案

ChatGPT无法登陆？分步排查指南与解决方案

ChatGPT作为全球领先的AI对话工具，日均处理超百万次登录请求，登陆问题可能导致用户无法正常使用服务，影响工作效率或学习进度。无论是显示「网络错误」「账号未激活」，还是持续加载无响应，本文将从网络连接、账号状态…

阅读更多...

用Joern执行CPGQL找到C语言中不安全函数调用的流程

用Joern执行CPGQL找到C语言中不安全函数调用的流程

1. 引入静态应用程序安全测试（Static application security testing）简称SAST，是透过审查程式源代码来识别漏洞，提升软件安全性的作法。 Joern 是一个强大的开源静态应用安全测试（SAST）工具，专…

阅读更多...

读文章 Critiques of World model

读文章 Critiques of World model

论文名称：对世界模型的批判作者单位： CMU， UC SD 原文链接：https://arxiv.org/pdf/2507.05169 摘要： 世界模型（World Model）——即真实世界环境的算法替代物，是生物体所体验并与之…

阅读更多...

利用docker部署前后端分离项目

利用docker部署前后端分离项目

后端部署数据库:redis部署:拉取镜像:doker pull redis运行容器:docker run -d -p 6379:6379 --name my_redis redismysql部署:拉取镜像:docker pull mysql运行容器:我这里3306被占了就用的39001映射docker run -d -p 39001:3306 -v /home/mysql/conf:/etc/mysql/conf.d -v /hom…

阅读更多...

YOLOv11调参指南

YOLOv11调参指南

YOLOv11调参 1. YOLOv11参数体系概述 YOLOv11作为目标检测领域的前沿算法，其参数体系可分为四大核心模块： 模型结构参数：决定网络深度、宽度、特征融合方式训练参数：控制学习率、优化器、数据增强策略检测参数：影响预测…

阅读更多...

云原生核心技术解析：Docker vs Kubernetes vs Docker Compose

云原生核心技术解析：Docker vs Kubernetes vs Docker Compose

云原生核心技术解析：Docker vs Kubernetes vs Docker Compose 🚢☸️⚙️ 一、云原生核心概念 ☁️ 云原生（Cloud Native） 是一种基于云计算模型构建和运行应用的方法论，核心目标是通过以下技术实现弹性、可扩展、高可…

阅读更多...

keepalive模拟操作部署

keepalive模拟操作部署

目录 keepalived双机热备一、配置准备二、配置双机热备（基于nginx） web1端修改配置文件配置脚本文件 web2端修改配置文件配置脚本文件模拟检测开启keepalived服务访问结果故障模拟中止nginx 查看IP 访问浏览器重启服务后…

阅读更多...

Java 中的 volatile 是什么？

Java 中的 volatile 是什么？

👉 volatile ：不稳定的英[ˈvɒlətaɪl] 美[ˈvɑːlətl] adj. 不稳定的;<计>易失的;易挥发的，易发散的;爆发性的，爆炸性的;易变的，无定性的，无常性的;短暂的，片刻的;活泼的&#xff…

阅读更多...

MongoDB性能优化实战指南：原理、实践与案例

MongoDB性能优化实战指南：原理、实践与案例

MongoDB性能优化实战指南：原理、实践与案例在大规模数据存储与查询场景下，MongoDB凭借其灵活的文档模型和水平扩展能力，成为众多互联网及企业级应用的首选。然而，在生产环境中，随着数据量和并发的增长，如何…

阅读更多...

细谈kotlin中缀表达式

细谈kotlin中缀表达式

Kotlin 是一种适应你编程风格的语言，允许你在想什么时候写代码就什么时候写代码。Kotlin 提供了一些机制，帮助我们编写易读易懂的代码。其中一个非常有趣的机制是中缀表达式（infix notation）。它允许我们定义和调用函数时省略点号…

阅读更多...

[Nagios Core] CGI接口 | 状态数据管理.dat | 性能优化

[Nagios Core] CGI接口 | 状态数据管理.dat | 性能优化

链接：https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/ docs：Nagios Core Nagios Core 是功能强大的基础设施监控系统，包含 CGI 程序，允许用户通过 Web 界面查看当前状态、历史记录等。通过以下技术栈实现…

阅读更多...

Linux进程优先级机制深度解析：从Nice值到实时调度

Linux进程优先级机制深度解析：从Nice值到实时调度

前言在Linux系统中，进程优先级决定了CPU资源的分配顺序，直接影响系统性能和关键任务的响应速度。无论是优化服务器负载、确保实时任务稳定运行，还是避免低优先级进程拖慢系统，合理调整进程优先级都是系统管理和性能调优的重要技能…

阅读更多...

深入浅出Kafka Broker源码解析（下篇）：副本机制与控制器

深入浅出Kafka Broker源码解析（下篇）：副本机制与控制器

一、副本机制深度解析 1.1 ISR机制实现 1.1.1 ISR管理核心逻辑 ISR（In-Sync Replicas）是Kafka保证数据一致性的核心机制，其实现主要分布在ReplicaManager和Partition类中： public class ReplicaManager {// ISR变更集合&#xff0…

阅读更多...

Fluent许可文件安装和配置

Fluent许可文件安装和配置

在使用Fluent软件进行流体动力学模拟之前，正确安装和配置Fluent许可文件是至关重要的一步。本文将为您提供详细的Fluent许可文件安装和配置指南，帮助您轻松完成许可文件的安装和配置，确保Fluent软件能够顺利运行。一、Fluent许可文件安装步骤…

阅读更多...

Python----大模型（ RAG的文本分割，文本分割方法）

Python----大模型（ RAG的文本分割，文本分割方法）

一、RAG文本分割RAG（Retrieval-Augmented Generation，检索增强生成）模型是一种结合了检索和生成能力的自然语言处理模型。它通过检索相关的文档片段，并将这些信息作为生成过程的上下文，以提高生成质量和准确性。在R…

阅读更多...

vue笔记3 VueRouter VueX详细讲解

vue笔记3 VueRouter VueX详细讲解

vueRouter & vueX 看到这里的朋友如果没有看过前几期，可以通过文章的链接跳转到第一期，从第一期的 vue2 语法开始学习，如果是复习的朋友，也可以看本期只学习 vueRouter & VueX 项目初始化经过上期，我们学习…

阅读更多...

从当下需求聊聊Apifox 与 Apipost 的差异

从当下需求聊聊Apifox 与 Apipost 的差异

作为一名长期投身于复杂项目开发的工程师，我深切体会到一款适配的接口管理工具对提升开发效率的关键意义。当团队在进行工具选型时，我对 Apifox 和 Apipost 展开了全面且系统的对比分析，其中的诸多发现，值得与大家深入探讨。一、…

阅读更多...

最新文章