【文献笔记】PointWeb

参考笔记:

https://blog.csdn.net/m0_69412369/article/details/143106494

https://www.cnblogs.com/A-FM/p/PointWeb.html

注:本文的大部分内容是转载而来


CVPR 2019:PointWeb: Enhancing Local Neighborhood Features for Point Cloud Processing

论文:https://ieeexplore.ieee.org/document/8954075

代码:https://github.com/hszhao/PointWeb

目录

1. 文章概要

2. PointWeb框架

2.1 核心理念:局部区域的上下文整合

2.2 Adaptive Feature Adjustment

2.2.1 影响函数 Impact Function

2.2.2 关系函数 Relation Function

2.2.3 图解 AFA

3. PointWeb用于点云语义分割任务的整体架构

3.1 整体架构流程

3.2 Set Abstraction Level 流程

3.3 代码


1. 文章概要

        本文研究如何有效聚合局部特征,提高点云数据的识别性能,提出了一种新的处理点云的方法 PointWeb,旨在从局部邻域中提取上下文特征。与之前的方法不同, PointWeb 通过密集连接局部邻域中的每个点,从而基于该区域的特性来调整每个点的特征。主要创新点包括引入了自适应特征调整模块(AFA:Adaptive Feature Adjustment),它通过学习点与点之间的交互来增强点云的局部特征。这一调整使得每个特征可以根据该区域内其他点的特征进行拉动或推送,从而更好地表达区域信息,提升点云分割和分类等任务的性能

图中展示了本文方法如何通过引入 AFA 模块增强局部区域内的特征整合能力,相较于传统方法,能够更全面地捕捉点云的上下文信息

(a)PointNet++:这是一种分层网络,通过共享多层感知器(MLP)来处理局部特征,特征聚合是通过 最大池化MaxPool 实现的。黄色箭头表示特征从中心点传播到其他点

(b)DGCNN:该方法将每个中心点与其最近的 K 个邻居连接,并通过计算中心点与邻居之间的特征差来聚合信息,最终通过 MLP + 最大池化MaxPool 进行处理。蓝色点表示整合了配对信息的特征

(c)PointWeb: 通过自适应特征调整模块 AFA将局部区域内的所有点连接起来,使得每个点都可以与该区域内的其他点进行特征交互。红色点表示整合了区域信息的特征。与直接从中心点到其他点进行聚合不同,AFA 自适应地学习每个点对其他点的影响,从而在整个区域内聚合特征

2. PointWeb框架

        PointWeb 的设计旨在解决传统点云处理方法中局部区域信息整合不足的问题,通过引入自适应特征调整模块 AFA ,该框架显著增强了局部邻域特征的表达能力。相比之下,传统方法只关注中心点与其最近邻居之间的关系,忽略了邻域内各点之间的交互,这种设计使得 PointWeb 在点云语义分割、点云分类等任务上表现优异

2.1 核心理念:局部区域的上下文整合

传统点云模型 PointNet++DGCNN 在处理局部领域时,通常只聚合中心点、邻居点之间的简单特征,如通过最大池化或连接最近邻的点

这种做法的局限在于:

  • 特征交互有限:中心点与邻居点之间的特征交互通常是单向的,没有充分利用邻域中所有点之间的上下文关系

  • 信息整合不充分:最大池化虽然有效,但无法精确表达局部邻域中的细微几何信息

为了解决这些问题,PointWeb 通过在局部邻域内互联所有点,使得邻域内所有点进行特征交换,这样就可以充分捕捉局部特征和上下文信息

2.2 Adaptive Feature Adjustment

Adaptive Feature AdjustmentPointWeb 的关键创新点。它的主要作用是学习点与点之间的关系,并根据这种关系自适应地调整各个点的特征

AFA 的工作原理可以分为以下几个步骤:

  • 输入特征的提取:对于给定的局部邻域 \color{red}R,假设该区域有 \color{red}M 个点,每个点的特征为F_1,F_2,...F_M,这些特征最初由 MLP 提取

  • 密集连接所有点:不同于仅连接中心点和最近邻居的做法,PointWeb 将局部区域内的每个点两两连接,构成一个完全连接的网络

  • 自适应特征调整AFA 通过学习每个点与其他点之间的特征差异,动态调整每个点的特征。特征调整的公式如下:

F'_i = F_i + \sum_{j=1}^{M} f_{\text{imp}}(F_i, F_j) \cdot f_{\text{rel}}(F_i, F_j) \;\;\;\;\;\;\;\;\;\;\;\;\color{red}(1)

F_i' :表示调整后的点特征

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/96618.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/96618.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用工招聘小程序:功能版块与前端设计解析

在当下就业市场日益活跃的背景下,用工招聘小程序应运而生,它以高效、便捷的特点,为求职者与企业搭建起一座沟通的桥梁。本文将深入分析这类小程序的核心功能版块及其前端设计,探讨其如何优化招聘流程,提升用户体验。用…

uTools 轻工具 简洁又方便

uTools 是一款跨平台轻工具平台,通过插件化设计提供高效工作方式,支持 Windows、MacOS、Linux 系统。 ‌ 核心功能 ‌超级搜索框‌:支持快捷键(默认 AltSpace)呼出,可搜索文件、网页、应用等。 ‌‌本地文…

图技术重塑金融未来:悦数图数据库如何驱动行业创新与风控变革

随着大数据的广泛应用和云计算的快速发展,金融行业的数据已经从“大”转向了“海”,从而对传统的数据处理、分析、挖掘等的方法和工具提出了更高的要求,也为金融领域的数据的海量的关联分析、实时的风控和复杂的决策支持等带来了一系列的挑战…

openEuler 24.03 (LTS-SP2)简单KVM安装+桥接模式

华为文档创建虚拟机步骤 配置bios支持虚拟化 2、检查系统是否支持虚拟化 3、安装虚拟化相关组件,并启动 yum install -y qemu virt-install virt-manager libvirt-daemon-qemu edk2-aarch64.noarch virt-viewer systemctl start libvirtd systemctl enable libvirtd4、创建…

Sentinel:微服务架构下的高可用流量防卫兵

一、引言:为什么需要Sentinel? 在分布式系统架构中,随着业务复杂度的提升和微服务架构的普及,服务之间的依赖关系变得越来越复杂。一个服务的不可用或异常可能会在整个系统中产生连锁反应,导致整个系统崩溃。这就是所…

详解 new 和 delete

目录 一、简要描述两者的作用 二、实例解析 1. 浅层区别 2. 深层区别 三、拓展(operator new 的妙用) 一、简要描述两者的作用 new : 是c推崇的 内存申请 方式,拥有比 malloc 更先进的机制 delete :是 对应的 内存释放方式,…

fMoE论文阅读笔记

原文链接:https://arxiv.org/pdf/2502.05370v1 在混合专家(MoE)架构中,初始阶段涉及输入样本通过GateNet进行多分类的鉴别过程,目的是确定最适合处理输入的专家模型。这个步骤被称为“experts selection”,…

Linux 禅道开源版安装

1、下载安装包安装wget https://www.zentao.net/dl/zentao/18.5/ZenTaoPMS.18.5.zbox_64.tar.gz tar zxf ZenTaoPMS.18.5.zbox_64.tar.gz/opt/zbox/zbox -ap 81 -mp 3307 # 指定apache服务端口 、 mysql服务端口 /opt/zbox/zbox start #启动禅道服务( 其他命令 /opt/zbox/…

PySpark基础知识(python)

PySpark 是 Apache Spark 的 Python API,它允许开发者使用 Python 语言编写 Spark 应用程序,结合了 Python 的易用性和 Spark 的分布式计算能力,是处理大规模数据的强大工具。 一、安装与环境配置 安装方式: 通过 pip 安装&#…

基于python大数据的电影数据分析可视化系统设计与应用

标题:基于python大数据的电影数据分析可视化系统设计与应用内容:1.摘要 本研究旨在设计并实现一个基于Python的大数据电影数据分析与可视化系统,以解决当前电影行业数据分散、分析效率低及可视化能力不足的问题。系统采用Python语言结合Pandas、NumPy进行数据清洗与…

【PyTorch】图像多分类

多类图像分类的目标是为一组固定类别中的图像分配标签。目录 加载和处理数据 搭建模型 定义损失函数 定义优化器 训练和迁移学习 用随机权重进行训练 用预训练权重进行训练 加载和处理数据 将使用 PyTorch torchvision 包中提供的 STL-10 数据集,数据集中有…

计算机视觉----opencv实战----指纹识别的案例

一、数据准备src2.BMPsrc1.BMPsrc.bmpmodel.BMP二、识别原理讲解(sift特征提取)SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)是一种经典的图像特征提取算法,核心优势是不受图像尺度缩放、旋转…

npm 发布流程——从创建组件到发布到 npm 仓库

1. 准备组件 1.1 创建一个 Vue 组件 假设我们要创建一个简单的按钮组件&#xff1a; src/MyButton.vue <template><button class"my-btn" click"$emit(click)"><slot /></button> </template><script setup lang"ts…

MySQL入门基础指南

目录 一、什么是数据库&#xff1f; 仅依靠文件存储数据存在以下几个明显缺点&#xff1a; 数据库的存储介质通常包括&#xff1a; 二、主流数据库介绍 三、客户端 VS 服务器 四、推荐看的MySQL安装技术博客 五、数据库的存储介质 数据库的存储介质主要分为以下两类&am…

【实战中提升自己完结篇】分支篇之分支之无线、内网安全与QOS部署(完结)

1 1拓扑 「模拟器、工具合集」复制整段内容 链接&#xff1a;https://docs.qq.com/sheet/DV0xxTmFDRFVoY1dQ?tab7ulgil1 分支无线部署 说明&#xff1a;分支无线用瘦AP部署&#xff0c;通过VPN直接注册到总部的AC上面&#xff0c;实现无线的业务提供&…

带你了解STM32:GPIO通用输入输出口

目录 3.1 GPIO简介 3.2 GPIO基本结构 3.3 GPIO位结构 输入部分&#xff1a; 二极管的保护作用&#xff1a; 施密特触发器&#xff1a; 片上外设端口 输出部分&#xff1a; MOS管 3.4 GPIO模式 3.4.1 浮空/上拉/下拉输入 3.4.2 模拟输入 3.4.3 开漏/推挽输出 3.4.…

Http(自写)

作为一个程序员&#xff0c;假设我们要在a电脑的进程里发一段数据到b电脑&#xff0c;一般使用socket编程&#xff0c;可选项也就tcp&#xff0c;udp二选一socket本质上就是一个代码库tcp有粘包问题&#xff08;字节流&#xff09;&#xff0c;纯裸tcp不能之际拿来使用所以我们…

C#使用OpenVinoSharp和PP-Human进行行人检测

效果 项目依赖 OpenCvSharp 4.11.0.20250507 OpenVINO.CSharp.Windows 2024.0.0.1 主要代码 using OpenCvSharp; using OpenVinoSharp; using System; using System.Windows.Forms;namespace HelloPPHuman {public partial class Form1 : Form{public Form1(){InitializeCo…

四、Scala深入面向对象:类、对象与伴生关系

在前几节中&#xff0c;我们学习了 Scala 的基础语法和流程控制。现在&#xff0c;我们将深入探索 Scala 作为一门纯粹的面向对象语言的核心。在 Scala 中&#xff0c;万物皆对象&#xff0c;没有像 Java 那样的原始类型和静态成员的区分。本节将重点介绍如何定义对象的蓝图&am…

【大语言模型 58】分布式文件系统:训练数据高效存储

分布式文件系统&#xff1a;训练数据高效存储 关键词&#xff1a;分布式文件系统、HDFS、Lustre、GlusterFS、数据本地性、I/O优化、存储架构、大数据存储、训练数据管理、存储性能调优 摘要&#xff1a;本文深入探讨大语言模型训练中的分布式文件系统技术&#xff0c;从存储架…