WWW‘25一通读 |图Anomaly/OOD检测相关文章(1)

写在前面:进入新一轮学习阶段,从阅读开始。
本文分享的是WWW2025收录的与作者研究相近的graph-based xx相关paper的阅读笔记,含个人理解,仅供参考😄

0x01 HEI:利用不变性原理实现异配图结构分布偏移学习

Jinluan Yang, et al. Leveraging Invariant Principle for Heterophilic Graph Structure.(浙大)

1.1 摘要

异配图神经网络(Heterophilic graph neural networks, HGNNs)在图的半监督学习任务中表现出了良好的效果。值得注意的是,大多数现实世界中的异配图是由不同邻接模式的节点混合而成的,呈现出局部节点级别的同配(Homophilic)和异配结构。

然而,现有的研究仅致力于设计更好的统一的HGNN架构,以同时用于异配和同配图上的节点分类任务,弄且它们对HGNN性能关于节点的分析仅基于已确定的数据分布,而没有探索由于训练节点和测试节点的结构模式差异所导致的影响。如何在异配图上学习不变的节点表示以处理这种结构差异活分布变化仍未得到探索。

在本文中,我们首先从数据增强的角度讨论了以往基于图的不变学习方法在解决异配图结构分布偏移的局限性。
然后,我们提出了HEI这一框架,它能够通过整合异配信息(即节点的估计邻接模式)来生成不变的节点表示,从而在无需扩充数据的情况下推断出潜在环境,并用于不变性预测。
我们提供了详细的理论保证以阐明HEI的合理性。在各种基准测试和骨干网络上的大量实验也表明,与现有的SOTA基线相比,我们的方法具有有效性和鲁棒性。

开源代码:HEI

1.2 背景与动机

异配图结构分布偏移(Heterophilic Graph Structure distribution Shift, HGSS):一种全新的数据分布偏移视角,用于重新审视现有的HGNNs工作。

尽管前景可观,但大多数先前的HGNNs假设节点共享已确定的数据分布,我们认为不同邻接模式的节点之间存在数据分布差异。如图1(a1)所示,异配图由具有局部同配性和异配性结构的节点混合组成,即节点具有不同的邻接模式。节点的邻接模式可以通过节点同配性来衡量,通过比较节点与其邻接节点的标签来表示同配水平。在此,我们将训练节点和测试节点之间不同的邻接模式识别为异配图结构分布偏移(图1(a2))。这种偏移在先前的工作中被忽视,但实际上影响了GNN的性能。如图1(a3)所示,我们在Squirrel数据集上可视化了训练节点和测试节点之间的HGSS。与测试节点相比,训练节点更倾向于高同配性,这可能导致测试性能下降。
值得注意的是,尽管一些近期的研究也探讨了同配和异配结构模式,但到目前为止,它们尚未为这一问题提供明确的技术解决方案。与专注于backbone设计的传统HGNN研究相比,从数据分布的角度寻求解决方案以解决HGSS问题显得尤为迫切。

现有基于图的不变性学习(Invariant learning)方法由于采用了基于扩充的环境构建策略,在处理HGSS问题时表现不佳。
在一般分布变化的背景下,不变性学习技术因其在减轻这方面的有效性越来越受到认可。其基本方法是学习节点表示,以促进在各种构建环境中进行不变性预测器的学习(图1(b1)),遵循风险外推(Risk Extrapolation, REx)原则。不幸的是,之前的基于图的不变学习方法可能无法有效地解决HGSS问题,主要是因为明确的环境可能对不变性学习无效。如(图1(c1))所示,在HGSS设置中,改变原始结构并不总是能影响节点的邻接模式。实际上,获得与邻域模式相关的最优且多样的环境是具有挑战性的。我们的观察(图1(c2))表明,EERM,一种利用环境扩充来解决节点级任务中的图分布变化的开创性不变性学习方法,在HGSS设置下表现不佳。有时,其改进效果还不如直接采用原始的V-Rex方法,后者是通过将训练节点随机分布在不同的环境组中实现的。我们将这种现象归因于不合理的环境构建。根据我们的分析,EERM实质上是V-Rex的节点环境增强版,即它们之间的性能差异仅仅被不同的环境构建策略影响。
HEI动机说明图图1:(a)展示了异配图结构分布偏移,其中图表和直方图显示了HGSS以及邻接模式在Squirrel数据集上的训练节点与测试节点之间的差异;(b)展示了先前不变学习工作与我们方法在数据增强方面不同环境构建策略的比较;(c)表明先前方法的环境构建可能无法有效解决HGSS,因为邻接模式未发生变化。传统方法与基于图的不变学习方法之间的实验结果可支持我们的分析并验证我们提出的HEI的优越性。

在训练阶段,我们如何确定一个合适的指标来估计节点的邻域模式,并利用它来推断潜在环境以解决HGSS问题。

1.3 Contributions

  1. New Issue. 强调了一个重要但常被忽视的异配图结构分布偏移(HGSS),这与大多数专注于backbone设计的异配图神经网络的研究不同;
  2. New Framework. 提出了HEI,一种新颖的基于图的不变学习框架,用于解决HGSS问题。与以往不同的是,我们的方法强调利用节点固有的异配信息来推断潜在环境,无需进行增强操作,从而显著提高了HGNN的泛化能力和性能;
  3. Exp. 在多个基准和骨干结构上展示了HEI的有效性。

即,异配图上的OOD泛化,构建环境时利用同配性(结构级别)指标进行构建,先前工作基本是节点级别。

在这里插入图片描述

在这里插入图片描述

0x02 SmoothGNN:一种用于无监督节点异常检测的平滑感知GNN

Xianyu Dong, et al. SmoothGNN: Smoothing-aware GNN for Unsupervised Node Anomaly Detection. (港中文)

2.1 摘要

在图学习中出现的平滑问题会导致节点表示无法区分,这给与图相关任务带来了巨大挑战。
然而,我们的实验表明,这个问题能够揭示节点异常检测(Node Anomaly Detection, NAD) 中先前研究所忽略的潜在特性。我们引入了个体平滑模式(Individual Smoothing Patterns, ISP)和邻域平滑模式(Neighborhood Smoothing Patterns, NSP),这表明异常节点的表示比正常节点的表示更难进行平滑处理。此外,我们探讨了这些模式的理论意义,展示了ISP和NSP对NAD任务的潜在益处。

受这些发现的启发,我们提出了SmoothGNN,这是一种新颖的无监督节点异常检测框架。
首先,我们设计了一个学习组件来明确捕捉ISP以检测节点异常。
其次,我们设计了一个谱神经网络来隐式学习ISP以增强检测能力。
最后,我们根据我们的发现设计了一个有效的系数,使得NSP可以作为节点表示的系数,有助于识别异常节点。
此外,我们设计了一种新颖的异常度量方法,用于计算节点的损失函数和异常得分,该方法利用ISP和NSP来反映NAD的特性。
在9个真实数据集上的大量实验表明,SmoothGNN比最佳竞争者平均高出14.66%(AUC)、7.28%(AP),运行速度提升了75倍。

开源代码:SmoothGNN

2.2 背景与动机

节点异常检测的常见应用场景,例如,金融网络中的欺诈检测、社交网络中的恶意评论检测、芯片制造中的热点检测。

在芯片制造中,Hotspot Detection(热点检测)是一项关键的质量控制技术,主要用于识别设计或制造过程中可能导致芯片缺陷的潜在问题区域。这些“热点”通常指设计中容易在光刻、蚀刻或其他工艺步骤中出现故障的局部图案(如短路、断路或可靠性问题),可能影响芯片的性能或良率。
即,工业制造中的缺陷检测

复杂的信息和大规模的现实世界的图对如何有效与高效地检测异常节点提出了挑战,特别是在无监督的设置下。现有方法:浅层模型由于手工规则而表现力有限,重建模型和子监督模型计算复杂度高,特殊模型民林寻找NAD有效标识符的挑战。

为了解决以上局限性,我们重新评估了NAD任务的传播过程,发现平滑(Smothing)问题可以为检测图中的异常提供潜在优势。具体来说,我们设计了两个新的衡量标准:ISP和NSP,从不同角度分析平滑问题。对于ISP,我们计算在每个传播跳的节点表示和收敛表示后获得的异常和正常节点的无限数量的跳数之间的平均归一化距离。对于NSP,我们分别计算异常和正常节点邻域内的平均归一化相似度。值得注意的是,这两种平滑模式在现实世界的数据集中(如Amazon和T-Finance)的不同类型的节点上表现出不同的行为,分别如图1和图2所示。在传播过程中,异常节点的平滑模式一般超过正常节点在大多数跳数。这一观察结果提供了一个潜在的指标,用于评估节点的异常分数:平滑模式越高,节点越有可能是异常的。
在这里插入图片描述

2.3 平滑模式的分析

预备知识

谱GNN图卷积运算可以通过Laplacians的第T阶多项式来近似: UgθUTx≈U(∑t=0TθtΛt)UTx=(∑t=0TθtLt)x,\mathbf U g_\theta \mathbf U^{T}\mathbf x \approx \mathbf U(\sum_{t=0}^T \theta_t \Lambda^t)\mathbf U ^T \mathbf x=(\sum_{t=0}^T \theta_t \mathbf L^t)\mathbf x,UgθUTxU(t=0TθtΛt)UTx=(t=0TθtLt)x 其中,θ∈RT+1\theta\in \mathbb R^{T+1}θRT+1是多项式系数。

如Figure2所讨论的,每个传播跳处的节点表示与在无限跳数之后获得的收敛表示之间的距离对于异常节点和正常节点表现出不同的模式。
ISP:
I(x)=∣∣(Pt−P∞)x∣∣22,I(\mathbf x)=||(P^t-P^\infty )x||^2_2,I(x)=∣∣(PtP)x22,其中,PtP^tPt是在传播的第ttt跳之后的传播矩阵,P∞P^\inftyP是收敛状态,xxx是图信号。如定义所示,ISP有效地描述了传播过程中每个独立节点的平滑模式,它可以捕获光谱信息和平滑模式。

NSP:N(xt)=∑i,j=1nai,j∣∣xitdi+1−xjtdj+1∣∣22,N(x^t)=\sum^n_{i,j=1}a_{i,j}||\frac{x_i^t}{\sqrt{d_i+1}}-\frac{x^t_j}{\sqrt{d_j+1}}||^2_2,N(xt)=i,j=1nai,j∣∣di+1xitdj+1xjt22,
其中,ai,ja_{i,j}ai,j表示邻接矩阵A~\tilde AA~的第(i,j)(i,j)(i,j)项,did_idi是节点iii的度,并且xt=Ptxx^t=P^txxt=Ptx。NSP测量相邻节点之间的相似性,指示在传播期间邻域内的平滑模式,NSP与谱空间具有很强的相关性,可以作为节点表示的系数。

我们还可以观察到,在所有层上应用NSP可以在某些数据集上提高性能,但并不是在所有数据集上都是如此。这样的结果证明了NSP的有效性,因为仅将其应用于最后一层或所有层都明显优于基线。因此,为了保持模型的简单性和稳定性,我们只将NSP应用于最后一层。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/922469.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/922469.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

static_cast:C++类型系统的“正经翻译官”

1. 背景与核心概念 1.1 C的“类型安全”哲学 想象一下,你所在的世界突然失去了所有规则:文字可以随意变成数字,人可以瞬间变成椅子,汽车能飞上天变成飞机… 这听起来像是疯狂的梦境,但对于早期C语言来说,这…

【嵌入式原理系列-第八篇】USART从原理到配置全解析

目录 一.通信领域基础知识介绍 1.1 串行和并行通信 1.2 同步和异步传输 1.3 串口和COM口 1.4 通信协议标准以及物理层定义 1.5 物理层协议之TTL / RS-232 / RS-485 二.USART介绍 2.1 USART特点介绍 2.2 UART和TTL / RS-232 / RS-485 2.3 USART硬线流控介绍 2.4 USAR…

MariaDB介绍和MariaDB包安装

文章目录MariaDB介绍和安装1.MariaDB介绍1.1 起源与背景1.2 核心特性1.2.1 高度兼容 MySQL1.2.2 优化的存储引擎1.2.3 企业级功能增强1.2.4 性能优化1.2.5 安全增强1.3 社区与生态1.4 应用场景1.5 总结2.MariaDB安装2.1 主机初始化2.1.1 设置网卡名2.1.2 设置ip地址2.1.3 配置镜…

双指针与滑动窗口算法精讲:从原理到高频面试题实战

引言:算法选择的十字路口 在算法面试中,双指针和滑动窗口如同两把瑞士军刀,能高效解决80%以上的数组和字符串问题。本文将深入解析这两种技术的核心差异,结合力扣高频题目,提供可直接复用的代码。 一、算法核心思想解析…

苹果MAC、MacBook air和pro安装windows双系统与iOS分发

文章目录1. main1.1 准备工作1.2 启动转换助理1.3 Windows安装1.4 苹果电脑安装Windows双系统切换2. 苹果(iOS)分发/上架2.1 上架App Store2.2 上架TestFlight2.3 webClip免签上架2.4 超级签名2.5 企业证书2.6 app分发系统Reference1. main 苹果电脑安装windows双系统 https:…

ArcGIS定向影像(1)——非传统影像轻量级解决方案

常常听到这样的需求,ArcGIS能让用户自己低成本的做出谷歌街景吗?现在 _ArcGIS Pro 3.2 和 ArcGIS Enterprise 11.2 _能够让用户不使用任何插件和扩展的情况下完成街景数据集的构建,数据管理,发布服务和调用的完整解决方案。非常体…

uni-app 网络之封装实战HTTP请求框架

前言在uniapp开发中,网络请求是每个应用都必不可少的功能模块。一个优秀的网络请求封装不仅能提高开发效率,还能增强代码的可维护性和可扩展性。本文将基于实际项目经验,详细介绍如何封装一个高效、可维护的Uniapp网络请求框架,并…

架构师成长之路-架构方法论

文章目录前言一、先搞懂:架构师不仅仅是“技术大佬”,更是“问题解决者”1.1 架构师的分类:不止“开发架构师”一种1.2 架构师要关注什么?别只盯着技术1.3 架构师解决问题的4步心法:从定义到落地1.4 架构师的成长攻略&…

uniapp在微信小程序中实现 SSE 流式响应

前言 最近需要使用uniapp开发一个智能对话页面,其中就需要使用SSE进行通信。 本文介绍下在uniapp中如何基于uni.request实现SSE流式处理。 在线体验 #小程序:yinuosnowball SSE传输格式 返回输出的流式块: Content-Type为text/event-stream 每个流式块均为 d…

STM32N6AI资料汇总

文章目录前言一、STM32N6硬件资源1.1 NUCLEO-N657X0-Q1.2 STM32N6570-DK1.3 正点原子STM32N647二、STM32N6软件资源2.1 STM32CubeN6例程资源包2.2 STM32图像信号处理器(ISP)调优软件2.3 正点原子N6开发板配套软件三、AI软件资源3.1 STM32N6 AI软件包总结…

Flask学习笔记(一)

1、环境准备pip install Flask使用Flask开发第1个入门程序:from flask import Flask app Flask(__name__) app.route(/) def hello_world():return Hello, World!if __name__ __main__:app.run()Flask构造函数将当前模块的名称(__name__)作为参数。2、route函数ap…

CSP认证练习题目推荐(4)

思维、贪心、综合 排队打水 这道题目不算难,但是不注意还是会出现很多错误,比如结构体的书写。以及自定义结构体排序。还有这里做的优化,使用前缀和记录打水的等待时间,但是这里很容易出错的点在于等待时间是应该是记录的前一个…

MySQL 视图的更新与删除:从操作规范到风险防控

MySQL 视图的更新与删除:从操作规范到风险防控 视图作为 “虚拟表”,其更新与删除操作常常让开发者困惑 ——“为什么更新视图会报错?”“删除视图会不会弄丢数据?” 实际上,80% 的视图操作问题都源于对 “视图依赖基表…

C 语言实现 I.MX6ULL 点灯(续上一篇)、SDK、deep及bsp工程管理

目录 一、汇编点灯转 C 语言实现 1. 关键字:volatile 2. 寄存器地址定义(两种方式) (1)直接宏定义地址 (2)结构体封装寄存器(优化访问) 3. 核心功能代码 &#xff…

DevOps实战(7) - 使用Arbess+GitPuk+sourcefare实现Node.js项目自动化部署

Arbess 是一款国产开源免费的 CI/CD 工具,工具支持一键部署,页面简洁易用。本文将详细介绍如何安装配置使用GitPuk、sourcefare、Arbess系统,使用流水线拉取GitPuk源码、使用sourcefare代码扫描、构建安装包并进行主机部署。 1、GitPuk 安装…

算法,蒜鸟蒜鸟-P1-理解“双指针”

欢迎来到啾啾的博客🐱。 记录学习点滴。分享工作思考和实用技巧,偶尔也分享一些杂谈💬。 有很多很多不足的地方,欢迎评论交流,感谢您的阅读和评论😄。 目录引言1 双指针:Two Pointers1.1 左右指…

使用cookiecutter创建python项目

一、关于Python项目结构Python 项目并没有完全统一的 “固定结构”,但行业内有一些广泛遵循的约定俗成的目录结构(尤其针对可分发的包或大型项目)。同时,确实有工具可以快速生成这些标准化结构,提高开发效率&#xff0…

台积电生态工程深度解析:从晶圆厂到蜂巢的系统架构迁移

当半导体巨头将工厂视为生态系统,用工程思维解决环境问题概述:生态系统的工程化再造台积电近日开展的"积蜜"项目绝非简单的企业CSR行为,而是一场将生态系统视为复杂系统进行工程化改造的技术实践。本文将从系统架构、数据监控、循环…

从零实现一个简易计算器

最近在刷算法题时,遇到了实现计算器的问题。一开始觉得很简单,但真正动手实现时才发现其中有很多细节需要考虑。今天就来分享一下我的实现思路和学到的经验。问题分析我们需要实现一个能够处理加减乘除四则运算的计算器,要正确处理运算符的优…

Actix-webRust Web框架入门教程

文章目录引言Actix-web是什么?准备工作你的第一个Actix-web应用理解代码结构处理请求和响应接收请求数据返回响应中间件 - 增强你的应用状态管理和依赖注入实用示例:构建RESTful API测试你的Actix-web应用部署Actix-web应用结语额外资源引言 嘿&#xf…