文献阅读——NeuroBayesSLAM

原文地址

1.核心理论:贝叶斯多感官整合框架

目标:结合视觉线索 c v i c_{vi} cvi和前庭线索 c v e c_{ve} cve来估计头部方向或位置 θ

贝叶斯公式

p ( θ ∣ c v i , c v e ) ∝ p ( c v i ∣ θ ) p ( c v e ∣ θ ) p ( θ ) p(\theta | c_{vi}, c_{ve}) \propto p(c_{vi} | \theta)p(c_{ve} | \theta)p(\theta) p(θcvi,cve)p(cviθ)p(cveθ)p(θ)

  • p ( θ ∣ c v i , c v e ) p(\theta | c_{vi}, c_{ve}) p(θcvi,cve):给定所有线索后, θ \theta θ 的后验概率分布。
  • p ( c v i ∣ θ ) / p ( c v e ∣ θ ) p(c_{vi} | \theta) / p(c_{ve} | \theta) p(cviθ)/p(cveθ):观察到线索 c v i / c v e c_{vi} / c_{ve} cvi/cve 的可能性,取决于真实状态 θ \theta θ
  • p ( θ ) p(\theta) p(θ) θ \theta θ 的先验概率(初始信念)。

简化假设

  • 没有先验时 p ( θ ) p(\theta) p(θ)均匀分布即为1。
  • 视觉和前庭线索的噪声相互独立。

时间迭代

p t ( θ ∣ c v i , c v e ) ∝ p t ( c v i ∣ θ ) p t ( c v e ∣ θ ) p t − 1 ( θ ∣ c v i , c v e ) p^t(\theta \mid c_{vi}, c_{ve}) \propto p^t(c_{vi} \mid \theta)p^t(c_{ve} \mid \theta)p^{t-1}(\theta \mid c_{vi}, c_{ve}) pt(θcvi,cve)pt(cviθ)pt(cveθ)pt1(θcvi,cve)

将当前时刻的线索与上一时刻的后验信念结合。
这个公式可以拆分为路径积分和地标校准:

路径积分 (Path Integration)

  • 利用前庭/运动线索更新估计。
  • 对应于贝叶斯框架中的前庭线索更新:

p t ( θ ∣ c v i , c v e ) ∝ p t ( c v e ∣ θ ) p t − 1 ( θ ∣ c v i , c v e ) p^t(\theta | c_{vi}, c_{ve}) \propto p^t(c_{ve} | \theta)p^{t-1}(\theta | c_{vi}, c_{ve}) pt(θcvi,cve)pt(cveθ)pt1(θcvi,cve)

模拟动物根据自身运动(步数、速度)不断更新位置的过程。

地标校准 (Landmark Calibration)

  • 利用视觉线索(熟悉地标)修正估计。
  • 对应于贝叶斯框架中的视觉线索更新:

p t ( θ ∣ c v i , c v e ) ∝ p t ( c v i ∣ θ ) p t − 1 ( θ ∣ c v i , c v e ) p^t(\theta \mid c_{vi}, c_{ve}) \propto p^t(c_{vi} \mid \theta)p^{t-1}(\theta \mid c_{vi}, c_{ve}) pt(θcvi,cve)pt(cviθ)pt1(θcvi,cve)

当看到熟悉的景象时,调整内部地图以匹配外部世界。

2.模型架构

在这里插入图片描述该图展示了模型的贝叶斯吸引子网络架构及其信息流动图表。

  • 头部方向细胞(Head Direction Cells)编码方向。
  • 网格细胞(Grid Cells)编码位置。

来自前庭线索和视觉线索的信息分别由整合细胞(Integrator Cells)和校准细胞(Calibration Cells)整合。

  • 整合细胞接收前庭路径积分信息。
  • 校准细胞接受视觉校准信息。

当线索冲突出现时,这两种细胞通过相互抑制和全局抑制来解决冲突,从而在网络中产生单峰活动。头部方向细胞网络中编码的方向被用于网格细胞网络中编码代理的位置。基于网格细胞网络提供的位置信息,构建了一个认知地图。

2.1 HD细胞网络

2.1.1表示
  • 每个细胞群体(整合细胞和校准细胞)维护一个一维高斯分布 p ( θ ) p(\theta) p(θ) 来表示对头部方向的信念。

p ( θ ) = 1 σ 2 π e − ∣ θ − μ ∣ 2 / 2 σ 2 p(\theta) = \frac{1}{\sigma\sqrt{2\pi}} e^{-|\theta - \mu|^2 / 2\sigma^2} p(θ)=σ2π 1eθμ2/2σ2

  • μ \mu μ:方向的最大似然估计(均值),代表当前头部方向
  • σ 2 \sigma^2 σ2:信念的不确定性(方差)
2.1.2 吸引子动力学

全局抑制:限制整体活动水平,防止过度兴奋。

1 ( σ inte t ) 2 = E W ( σ inte t − 1 ) 2 , 1 ( σ cali t ) 2 = E W ( σ cali t − 1 ) 2 \frac{1}{(\sigma_{\text{inte}}^{t})^{2}} = \frac{E}{W(\sigma_{\text{inte}}^{t-1})^{2}}, \quad \frac{1}{(\sigma_{\text{cali}}^{t})^{2}} = \frac{E}{W(\sigma_{\text{cali}}^{t-1})^{2}} (σintet)21=W(σintet1)2E,(σcalit)21=W(σcalit1)2E

  • W W W 是总信息量
  • E E E 是预设的总信息量上限

相互抑制:确保网络中只有一个稳定的“活动包”(单峰)占据主导地位。

1 ( σ inte t ) 2 = 1 ( σ inte t − 1 ) 2 − Δ inte 1 ( σ cali t − 1 ) 2 , 1 ( σ cali t ) 2 = 1 Δ cali 1 ( σ inte t − 1 ) 2 \frac{1}{(\sigma_{\text{inte}}^{t})^{2}} = \frac{1}{(\sigma_{\text{inte}}^{t-1})^{2}} - \Delta_{\text{inte}} \frac{1}{(\sigma_{\text{cali}}^{t-1})^{2}}, \quad \frac{1}{(\sigma_{\text{cali}}^{t})^{2}} = \frac{1}{\Delta_{\text{cali}}} \frac{1}{(\sigma_{\text{inte}}^{t-1})^{2}} (σintet)21=(σintet1)21Δinte(σcalit1)21,(σcalit)21=Δcali1(σintet1)21

  • Δ inte \Delta_{\text{inte}} Δinte Δ cali \Delta_{\text{cali}} Δcali 控制抑制强度
2.1.3路径积分更新

μ i n t e t = mod ( μ i n t e t − 1 + v t Δ t , 2 π ) \mu_{inte}^t = \text{mod}(\mu_{inte}^{t-1} + v^t \Delta t, 2\pi) μintet=mod(μintet1+vtΔt,2π)

μ c a l l t = mod ( μ c a l l t − 1 + v t Δ t , 2 π ) \mu_{call}^t = \text{mod}(\mu_{call}^{t-1} + v^t \Delta t, 2\pi) μcallt=mod(μcallt1+vtΔt,2π)

  • v t v^t vt:来自前庭系统的速度信息。
  • 由于方向具有周期性,故对 2 π 2\pi 2π取mod。
2.1.4视觉校准更新

当检测到熟悉视觉场景时,校准细胞接收注入能量 p inject ( θ ) p_{\text{inject}}(\theta) pinject(θ)

1 ( σ cali t ) 2 = 1 ( σ cali t − 1 ) 2 + 1 ( σ inject t ) 2 \frac{1}{(\sigma^t_{\text{cali}})^2} = \frac{1}{(\sigma^{t-1}_{\text{cali}})^2} + \frac{1}{(\sigma^t_{\text{inject}})^2} (σcalit)21=(σcalit1)21+(σinjectt)21

μ cali t = mod ( ( σ cali t ) 2 ( σ cali t − 1 ) 2 μ cali t − 1 + ( σ cali t ) 2 ( σ inject t ) 2 μ inject t , 2 π ) \mu^t_{\text{cali}} = \text{mod}\left( \frac{(\sigma^t_{\text{cali}})^2}{(\sigma^{t-1}_{\text{cali}})^2} \mu^{t-1}_{\text{cali}} + \frac{(\sigma^t_{\text{cali}})^2}{(\sigma^t_{\text{inject}})^2} \mu^t_{\text{inject}} \,,\, 2\pi \right) μcalit=mod((σcalit1)2(σcalit)2μcalit1+(σinjectt)2(σcalit)2μinjectt,2π)

  • σ inject t \sigma^{t}_{\text{inject}} σinjectt:注入能量的标准差
  • μ inject t \mu^{t}_{\text{inject}} μinjectt:注入能量的均值(预期校准方向)

最终信念是整合细胞和校准细胞信念的融合:

1 ( σ f t ) 2 = 1 ( σ inte t ) 2 + 1 ( σ cali t ) 2 \frac{1}{(\sigma_f^t)^2} = \frac{1}{(\sigma_{\text{inte}}^t)^2} + \frac{1}{(\sigma_{\text{cali}}^t)^2} (σft)21=(σintet)21+(σcalit)21

μ f t = mod ( ( σ f t ) 2 ( σ inte t ) 2 μ inte t + ( σ f t ) 2 ( σ cali t ) 2 μ cali t , 2 π ) \mu_f^t = \text{mod} \left( \frac{(\sigma_f^t)^2}{(\sigma_{\text{inte}}^t)^2} \mu_{\text{inte}}^t + \frac{(\sigma_f^t)^2}{(\sigma_{\text{cali}}^t)^2} \mu_{\text{cali}}^t \,,\, 2\pi \right) μft=mod((σintet)2(σft)2μintet+(σcalit)2(σft)2μcalit,2π)

  • σ f t \sigma_f^t σft:综合不确定性的标准差
  • μ f t \mu_f^t μft:综合方向估计(整合与校准的加权融合结果)
  • 公式说明:
    • 第一条公式体现整合(路径积分)和校准(地标修正)不确定性的加权调和平均
    • 第二条公式通过方差倒数作为权重,融合整合细胞( μ inte t \mu_{\text{inte}}^t μintet)和校准细胞( μ cali t \mu_{\text{cali}}^t μcalit)的估计

2.2 网格细胞网络

2.2.1表示
  • 类似于 HD 网络,但使用二维高斯分布 p ( x , y ) p(x, y) p(x,y) 来表示对位置的信念。

p ( x , y ) = 1 2 π σ x σ y e − ( ( x − μ x ) 2 2 σ x 2 + ( y − μ y ) 2 2 σ y 2 ) p(x, y) = \frac{1}{2\pi\sigma_x\sigma_y} e^{-\left( \frac{(x - \mu_x)^2}{2\sigma_x^2} + \frac{(y - \mu_y)^2}{2\sigma_y^2} \right)} p(x,y)=2πσxσy1e(2σx2(xμx)2+2σy2(yμy)2)

  • ( μ x , μ y ) (\mu_x, \mu_y) (μx,μy):位置的最大似然估计(均值),代表机器人在物理空间中的位置
  • σ x 2 , σ y 2 \sigma_x^2, \sigma_y^2 σx2,σy2:信念在两个维度上的不确定性
2.2.2神经空间
  • 采用具有周期性边界条件的二维神经空间(环面吸引子)。
  • ( x , y ) ∈ [ 0 , 2 π ) (x, y) \in [0, 2\pi) (x,y)[0,2π)
  • 均值 ( μ x , μ y ) (\mu_x, \mu_y) (μx,μy) 编码的实际位置需要通过解卷绕(unwrapping)操作来恢复
2.2.3更新机制

机制与HD网络类似,但作用于二维位置。

3 系统实现

在这里插入图片描述
图片展示了NeuroBayesSLAM系统的软件架构。传感器/bagfile节点提供图像和里程计信息。视觉里程计为纯视觉数据集提供速度估计。局部视图单元节点确定当前视图是否熟悉。贝叶斯吸引子网络节点执行路径积分并做出环闭合决策。经验地图节点生成拓扑地图。整个系统通过这些组件协同工作,实现对环境的建模和导航。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/80991.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sentinel核心原理-高频问题

核心原理 ‌限流实现机制‌ ‌滑动窗口算法‌:将时间切分为子窗口动态统计QPS,避免固定窗口的边界问题。‌责任链模式‌:通过NodeSelectorSlot、FlowSlot等Slot链式处理限流逻辑。 ‌熔断降级策略‌ ‌慢调用比例‌:当慢请求比例…

DataX 的大概简单介绍(与Kettle做对比介绍)

DataX 是由阿里巴巴开源的轻量级 ETL 工具,专为批量数据同步设计,主打 “高性能、易扩展、跨数据源”。如果你熟悉 Kettle,可把它理解为 “更适合大数据场景的 ETL 选手”。以下从核心特性、应用场景、与 Kettle 对比等角度通俗解析&#xff…

通过上传使大模型读取并分析文件实战

一、技术背景与需求分析 我们日常在使用AI的时候一定都上传过文件,AI会根据用户上传的文件内容结合用户的请求进行分析,给出用户解答。但是这是怎么实现的呢?在我们开发自己的大模型应用时肯定是不可避免的要思考这个问题,今天我会…

RHCSA Linux 系统 硬盘管理

Linux 系统 硬盘管理 1扇区 512B,分区 多个扇区 512B 查看硬盘命令 [rootlocalhost ~]# lsblk 1.一般存储相关操作 (1) 分区 ① MBR 分区 ➤分区数量限制:主分区 0 - 4 个&#x…

计算机网络——Session、Cookie 和 Token

在 Web 开发中,Session、Cookie 和 Token 是实现用户会话管理和身份验证的核心技术。它们既有联系,也有明显区别。以下从定义、原理、联系、区别和应用场景等方面详细解析。 一、基本定义与原理 1. Cookie 定义: 是浏览器存储在客户端的小…

双均线量化交易策略指南

策略原理 采用两条不同周期的简单移动平均线(SMA): 短期均线:5日线(快速反应价格变化)长期均线:20日线(反映长期趋势) 交易信号生成规则: 当 5日线 > …

视频太大?用魔影工厂压缩并转MP4,画质不打折!

在日常生活中,我们常常需要将视频文件转换成不同的格式以适应各种设备或平台的播放需求。魔影工厂作为一款功能强大且操作简单的视频转换工具,深受用户喜爱。本文中简鹿办公将手把手教你如何使用魔影工厂将视频转换为MP4格式,并进行个性化设置…

大腾智能 PDM 系统:全生命周期管理重塑制造企业数字化转型路径

在当今激烈的市场竞争中,产品迭代速度与质量已成为企业生存与发展的核心命脉。面对客户需求多元化、供应链协同复杂化、研发成本管控精细化等挑战,企业亟需一套能够贯穿产品全生命周期的数字化解决方案。 大腾智能PDM系统通过构建覆盖设计、研发、生产、…

CodeBuddy一腾讯内部已有超过 85% 的程序员正在使用de编程工具

大家好,我是程序员500佰,目前正在前往独立开发路线,我会在这里分享关于编程技术、独立开发、技术资讯以及编程感悟等内容。 如果本文能给你提供启发和帮助,还请留下你的一健三连,给我一些鼓励,谢谢。 本文直…

解锁 Zblog 资讯系统:502 错误修复与双域名适配的实战秘籍

在网络世界的激烈竞争中,资讯类网站如同战场上的士兵,每一次页面加载、每一次内容展示都关乎着用户的留存与转化。而 Zblog 作为备受青睐的资讯系统,承载着众多站长的流量梦想。然而,在网站运营过程中,502 错误页面的突…

今日打卡,Leetcode第四题:寻找两个正序数组的中位数,博主表示就会sorted

4. 寻找两个正序数组的中位数 博主只会第一个暴力解法,然后将官网上的源码上添加些注释,尝试理解,分下今日刷题记录 题目描述 给定两个大小分别为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出并返回这两个…

Jouier 普及组十连测 R3

反思 首先,先悔恨一下这次的比赛成绩。 这次比赛的教训就是,简单的题目一定要打不要被复杂的题面震慑到,以及变量名不能是保留字,如第一题的x1,y1,要开long long,计算好数据范围,如第三第四题。…

Open CASCADE学习|非线性方程组求解技术详解

引言 在几何建模与工程计算中,非线性方程组的求解是常见的核心问题。Open CASCADE(以下简称OCC)作为开源的几何建模内核,提供了丰富的数学工具库,其中math_FunctionSetRoot类专为求解非线性方程组设计。本文将深入探讨…

科技初创企业创新推动商业未来

在这个因变革而蓬勃发展的世界里,科技初创企业已成为各行业创新、颠覆与转型的驱动力。这些雄心勃勃的企业正在重塑商业格局,挑战既定规范,并不断突破可能性的边界。本文将深入探索科技初创企业的精彩领域,探讨它们如何通过创新塑…

霍尼韦尔HMR2300-D00-485数字模块

型号:HMR2300-D00-485 类型:数字通信模块(RS-485接口) 制造商:霍尼韦尔(Honeywell),隶属于其工业自动化或楼宇自动化产品线。 典型用途: 用于扩展主控制器(如…

如何在 Windows 11 或 10 上更改 WIFI 或以太网 MAC 地址?

无论你使用的是哪种操作系统,更改 MAC 地址在各种场景中都有其益处。每个网卡的 MAC 地址都是唯一的,由网络适配器在出厂时就已经分配完成;它帮助系统在物理网络上进行通信,并为其提供身份识别。然而,如果你出于某种合法原因想要更改 Windows 上的当前 MAC 地址,那么我们…

Python语法特点与编码规范

注释 单行注释 把#号当做注释符号 多行注释 python中并没有规定多行注释标记,通常使用单引号作为多行注释 中文注释 规定文件所用编码,当时是为解决python2不支持中文的问题 #codingutf-8代码缩进 python采用代码缩进和冒号区分代码层次&#xff0c…

跟Gemini学做PPT:字号选择

字号的选择对于 PPT 的可读性和视觉效果至关重要。以下是一些通用的建议和针对你具体情况的字号选择指南: 通用字号选择原则: 对比度: 文字颜色与背景颜色形成高对比度,确保易读。字体: 选择清晰、专业的字体&#x…

【JVM 03-JVM内存结构之-虚拟机栈】

虚拟机栈 笔记记录 1. 定义1.1 演示栈帧 2. 特点3. 线程运行诊断3.1 案例1 cpu占用过多&解决3.2 案例2 程序运行很长时间没有结果 4. 拓展知识&问题辨析4.1 栈的内存越大越好嘛?(不是)4.2 方法内的局部变量是否线程安全?(是线程安全的)4.2.1 局部…

文章记单词 | 第104篇(六级)

一,单词释义 keyboard /ˈkiːbɔːrd/ n. 键盘underlying /ˌʌndərˈlaɪɪŋ/ adj. 潜在的;根本的;基础的June /dʒuːn/ n. 六月tactics /ˈtktɪks/ n. 战术;策略;手段south /saʊθ/ n./adj./adv. 南方&#x…