论文解读 | Franka 机器人沉浸式远程操作:高斯溅射 VR 赋能的遥操框架研发与应用

研究背景

在工业制造、危险环境作业等领域,机器人远程操作技术是突破人类作业边界的关键手段。传统远程操作依赖2D 相机反馈与操纵杆控制,存在空间感知差、操作精度低、沉浸感弱等问题,难以满足复杂移动操作任务需求。

例如在核设施退役、灾后救援等场景中,操作员无法精准判断机器人与障碍物的相对位置,易导致操作失误。

针对这一痛点,研究人员以Franka Research 3机器人为核心实验载体,提出 “高斯溅射 + VR” 融合的双阶段远程操作框架。该框架通过高斯溅射技术构建高保真3D 环境模型,结合VR设备实现沉浸式交互,同时设计 “导航 - 操作” 双阶段工作流程,解决传统系统在遮挡处理、空间连贯性、操作直观性上的缺陷。

最终通过实验验证,该框架能使66%的操作者完成任务时间平均缩短43%,93%的操作者更偏好该操作模式,显著提升远程操作的效率与可靠性。

图 1:本图展示了我们所提出框架的一个应用示例。左侧为通过高斯溅射(Gaussian splattering)技术重建的机器人及场景的虚拟现实呈现;右侧为安装在移动基座上的实体机器人在实际环境中执行操作阶段的状态。

研究核心亮点

高斯溅射3D 环境重建:通过 “多视角图像采集→SfM 算法特征计算与姿态估计→神经渲染训练高斯模型” 流程,生成含位置、颜色、透明度参数的高保真 3D 场景,有效处理遮挡问题,支持 VR 环境内自由调整视角,提升空间感知能力。

 2Splat 界面,显示了叠加在显示屏上的两个摄像头视图。实际处于虚拟现实(VR)环境中的用户,看到的是叠加在物体上方的静态 Splat(而非物体本身),并且能够对 VR 中显示的操纵器末端执行器(End Effector)进行操作。

双阶段远程操作逻辑:导航阶段用2D 相机视频流 + VR 控制器速度指令,控制移动基座精准定位;操作阶段通过 VR 界面直接拖动虚拟机械臂末端,实时同步真实 Franka 机械臂运动,兼顾移动效率与操作精度。

跨平台适配架构:基于Unity+ROS+TCP 通信,支持 URDF 模型导入,仅需修改 ROS 话题与关节参数,即可适配不同型号机械臂,降低技术迁移成本。

实验配置

  • 核心机器人Franka Research 3机械臂,负责完成按钮按压、精细抓取等操作任务;搭配 Robotnik Summit-XL移动基座,提供长距离移动能力。

  • 视觉采集设备:Intel RealSense D435F RGB-D相机,安装于机械臂末端,用于采集场景图像以生成高斯溅射模型,同时提供真实场景视频反馈。

  • 交互与计算设备:Meta Quest 2 VR头显,提供沉浸式操作界面;Intel NUC作为控制中枢,连接相机、机械臂与基座;搭载NVIDIA RTX 3090 GPU的计算机,运行Unity引擎与高斯溅射模型训练算法。

软件系统

操作系统与中间件:机器人端采用Ubuntu 20.04系统,部署ROS Noetic实现设备通信与指令调度;VR交互端基于Windows 10系统,运行Unity 2022.3构建VR 交互界面。

算法库:集成OpenCV预处理图像,COLMAP实现SfM计算,自定义PyTorch框架模块训练高斯溅射模型,保障3D重建与实时渲染效率。

实验设计与验证

遮挡环境按钮操作:实验台放置 Household 物品遮挡目标按钮,模拟工业场景视线受阻任务;操作员先通过导航阶段定位至实验台,再用 VR + 高斯溅射模型控制机械臂绕过遮挡按压按钮。

图3:本图展示了第一个操作场景的设置情况:在杂乱环境中,机器人需触达某一按钮。该按钮安装在一个基座上,此基座会遮挡机器人摄像头的视野。

Franka沉浸式遥操

动态障碍灯光激活:实验区域摆放带顶部灯光的锥形障碍,操作员控制机器人在障碍间导航,到达目标后按压按钮激活灯光,验证导航 操作” 流程连贯性。

 4:操作员使用我们的遥操作框架执行两项局部操作任务的演示。(a)至(c)图展示机器人向目标位置导航,并成功触达按钮且无任何碰撞;(d)至(f)图呈现操作员通过该框架靠近每个椎体,通过与椎体交互激活其顶部安装的指示灯。

验证方法

用户研究:选取 15 名操作员(含 名 VR 经验者、10 名无经验者),对比传统 双相机 操纵杆” 与本框架的任务完成时间、精度,通过 分量表评估易用性、沉浸感等指标。

实物验证:在真实场景中重复任务 10 次,记录机械臂操作成功率、碰撞发生率,验证框架稳定性。

图5:用户研究中量表问题的结果,该研究用于评估两种界面的可用性与直观性。研究采用 7 分量表,其中 1 分代表 “强烈不同意”,7 分代表 “强烈同意”。

关键成果与突破

突破空间感知瓶颈:高斯溅射+VR解决2D反馈的平面化缺陷,遮挡场景操作精度提升40%以上,降低操作认知负荷,推动远程操作向低门槛化发展。

建立一体化控制范式:双阶段流程实现“高效移动 - 精准操作” 闭环,适配仓储分拣、设备维护等场景;跨平台架构降低企业技术升级成本,助力产业化应用。

拓展应用边界:可用于核辐射、化工等危险环境无人作业,未来结合动态重建技术可适配流水线等动态场景,为医疗远程手术等领域提供技术支撑。

结语

研究人员以Franka Research 3为载体,研发的 “高斯溅射 + VR” 远程操作框架,从技术上解决传统系统的核心痛点,经实验验证具备效率、精度与易用性优势。

未来将聚焦三方向优化:一是突破SfM 限制,提升高斯模型生成速度以适配动态场景;二是引入 AI 辅助决策,提供操作路径推荐;三是拓展多机器人协同功能,满足大型场景联动需求。该框架不仅为机器人远程操作提供新路径,也为工业自动化、危险环境作业等领域技术升级奠定基础。

论文详情:https://arxiv.org/pdf/2504.15229

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/95455.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/95455.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Unity Shader学习笔记】(四)Shader编程

一、OpenGL与DirectX 这是计算机图形学中两个最核心的应用程序接口(API),它们充当了应用程序与显卡硬件之间的桥梁,让开发者能够调用GPU进行图形渲染和通用计算。 特性维度 OpenGL DirectX 主导公司 Khronos Group (原SGI) Microsoft

程序员之电工基础-初尝线扫相机

一、背景 兴趣爱好来了,决定研发一个产品。涉及到电工和机械等知识,所以记录一下相关的基础知识。本期主题是初尝线扫相机,虽然又回到了编程,但是对于我来说,硬件集成的经验不足,缺乏相机、镜头的专业知识。…

qt QWebSocket详解

1、概述 QWebSocket是Qt网络模块中的一个类,用于实现WebSocket协议的通信。WebSocket是一种全双工的通信协议,允许在客户端和服务器之间建立实时的双向通信。QWebSocket提供了对WebSocket协议的支持,使得开发者能够在Qt应用中方便地实现实时…

Java基础IO流全解析:常用知识点与面试高频考点汇总

Java基础IO流全解析:常用知识点与面试高频考点汇总 前言 IO(Input/Output)流是Java中处理数据传输的核心机制,无论是文件操作、网络通信还是数据持久化,都离不开IO流的身影。对于Java初学者而言,IO流的分类…

PDF.AI-与你的PDF文档对话

本文转载自:PDF.AI-与你的PDF文档对话 - Hello123工具导航 ** 一、🤖 PDF.AI:秒懂 PDF 的智能对话助手 PDF.AI 是一款超实用的AI 文档分析工具,专门帮你快速搞定各种 PDF 文件。不管多长的合同、报告或论文,你只需上…

微软出品!这个免费开源工具集获得了GitHub 123k程序员点赞

大家晚上好,我是顾北,是一名AI应用探索者,当然也是GitHub开源项目收集爱好者。最近我在整理Windows效率工具时,发现了一个让我一晚上没睡着觉的开源项目——微软官方出品的 PowerToys,可谓是彻夜难眠啊。经过我两个月多…

【开题答辩全过程】以 小众商户小程序为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

Vue 3.5 重磅新特性:useTemplateRef 让模板引用更优雅、更高效!

Vue 3.5 重磅新特性:useTemplateRef 让模板引用更优雅、更高效! 目录 前言 什么是 useTemplateRef 传统 ref 的问题 useTemplateRef 的优势 基础用法 进阶用法 最佳实践 迁移指南 性能对比 注意事项 总结 前言 Vue 3.5 带来了一个激动人心的新特性 useTemplateRef,它彻底革…

uni app 的app端 写入运行日志到指定文件夹。

uni app 的app 端 写入指定目录文件夹。并自动生成当前日期的日志文件。删除十日前的日志文件其中 writefile.js 代码如下const {default: logger } require("./logger")var name var url var params var method var resfunction setlog(name, url, params, method)…

桌面应用开发语言与框架选择指南

桌面应用开发的语言和框架选择非常丰富,从原生性能到跨平台解决方案应有尽有。下面我将它们分为几大类进行详细介绍,并附上各自的优缺点和适用场景。 一、 原生开发 (Native Development) 原生开发能提供最佳的性能和与操作系统最完美的集成体验。 1. …

C++知识

文章目录1.Cmap为什么线程不安全?2.map大量插入会有性能问题,为什么3.set的应用场景4.map set mutiset mutimap unordered_map unordered_set的底层实现、使用场景、优缺点1.Cmap为什么线程不安全? 其实STL中的容器都是线程不安全的,如果想要线程安全…

自学嵌入式第三十四天:网络编程-TCP

一、UDP用户数据报收发次数要对应;数据与数据之间有边界,多次调用收发时都是不同的数据报;接收方的数据大小>发送方的数据大小,如果接受方数据小了则会丢弃未读的部分,再次调用只会读下一包数据;二、服务…

Apache IoTDB:国产时序数据库的崛起与工业物联网的未来

📑前言 在工业物联网的浪潮中,数据不再是副产品,而是驱动决策的核心资产。"随着物联网、工业互联网和智能监控的迅猛发展,时序数据正以前所未有的速度爆发。据预测,到2025年全球物联网设备将达750亿台&#xff0c…

一键核验,安全无忧!手机号三要素详情版API,为您的业务筑牢身份认证防线

一、什么是手机号三要素核验API? 手机号三要素核验API 是一种通过编程接口,实时验证一条个人身份信息是否与该国运营商登记的实名信息一致的在线服务。 这里的“三要素”特指: 姓名 身份证号码 手机号码 核验过程:用户提交上述三个…

轻松上手 qData 数据中台开源版:Docker Compose 助你10分钟跑起来

说在前面 谁适合看这份指南? 初次接触 qData,希望快速体验功能的小伙伴不想折腾复杂环境配置和前端打包的人想用“一键启动”省事体验完整平台的用户 我们已经为你准备好“开箱即用”的完整部署包,包括: ✅ 前端静态资源&…

Qt读写Excel--QXlsx基本使用

1、概述 Document 类是一个用于操作 XLSX 文件的类,继承自 QObject。它提供了对 Excel 文件的读写操作,包括单元格的读写、图片和图表的插入、单元格合并、列和行的格式化、数据验证和条件格式化等功能。此外,它还支持对工作簿和工作表的操作…

P13929 [蓝桥杯 2022 省 Java B] 山 题解

缩减一下题目的意思,问区间 [2022,2022222022] 有多少个数是回文数并且先单调不减,后单调不增。 因为有这两条条件,我们可以得知在判断时只用判断前半段的每个数是不是和对面相应的位置相等,以及是否单调不减。 为什么不用看后半段…

Unity Android 文件的读写

配置AndroidManifest 文件在Assets 目录下查找AndroidManifest 文件&#xff0c;添加权限声明&#xff0c;在application 节点中添加requestLegacyExternalStorage 属性。<!-- 权限声明 --> <uses-permission android:name"android.permission.READ_EXTERNAL_STO…

Pydantic模型验证测试:你的API数据真的安全吗?

url: /posts/03b2afdf35f55dbaef631710ab6da82c/ title: Pydantic模型验证测试:你的API数据真的安全吗? date: 2025-09-03T23:46:18+08:00 lastmod: 2025-09-03T23:46:18+08:00 author: cmdragon summary: Pydantic在FastAPI中用于数据验证和序列化,通过Python类型注解自动…

【Proteus仿真】AT89C51单片机中断系列仿真——INT0中断控制LED小灯/INT0和INT1中断控制数码管

目录 0案例视频效果展示 0.1例子1&#xff1a;INT0控制LED闪烁 0.2例子2&#xff1a;INT0中断控制数码管计数 0.3例子3&#xff1a;INT0中断实现秒表功能 0.4例子4&#xff1a;INT0INT1中断控制数码管计数 1基础知识补充——中断系统 1.1 中断源一览 1.2 控制寄存器 1…