计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点可视化分析

追踪计算机视觉领域的前沿热点是把握技术发展方向、推动创新落地的关键,分析这些热点,不仅能洞察技术趋势,更能为科研选题和工程实践提供重要参考。本文对计算机视觉顶刊《International Journal of Computer Vision》2025年5月前沿热点进行了可视化分析。欢迎阅读和转发。

本文作者为韩煦,审核为邓镝。

一、期刊介绍

《国际计算机视觉杂志》(International Journal of Computer Vision简称IJCV)是计算机视觉领域的顶级期刊。该期刊现为月刊(每年出版12期),致力于发表高质量、原创性的学术论文,以推动计算机视觉科学与工程的蓬勃发展。期刊影响因子11.6(2023),5年期刊影响因子14.5(2023),提交首次决定(中位数)96天。表1展示了IJCV近5年发表文章的数量及期刊的影响因子(IF)的变化情况。

1 IJCV每年的文章数量和影响因子

年度

文章数/年

IF

2023

198

11.6

2022

187

19.5

2021

130

13.3

2020

187

7.4

2019

90

5.7

该期刊的讨论主题领域主要聚焦于计算机视觉领域,具体来说包括图像形成、处理、分析与解读、机器学习技术、统计方法;传感器技术;基于图像的渲染、计算机图形学、机器人技术、影像解译、图像检索、视频分析与标注、多媒体等;视觉计算模型及人脑视觉架构研究。

期刊网址https://link.springer.com/journal/11263

二、热点分析

2 论文标题中出现的高频主题词

高频主题

翻译

出现次数

核心方向

Generation

生成

8

故事 / 图像 / 视频生成

Consistency

一致性

6

多视图、跨模态、角色身份一致性

Re-identification

重识别

4

行人 / 视频重识别

Semantic Segmentation

语义分割

4

弱监督 / 跨模态 / 医学场景

Diffusion Models

扩散模型

3

动态跟踪、长视频生成

3D Reconstruction

3D 重建

3

神经场景、形状表示

Self-Supervised

自监督学习

3

无监督 / 少监督复杂任务

Multi-modal

多模态

3

视觉 - 语言、跨模态蒸馏

Medical Image

医学影像

2

分割、肿瘤预测

Adversarial Learning

对抗学习

2

质量评估、攻击防御

Multi-view

多视图

2

SLIDE(多视图一致性)、多视图立体网络(深度估计)

Unsupervised

无监督

2

跨模态蒸馏语义分割

Semi-supervised

半监督

2

医学影像分割、联邦半监督学习

DeepFake Detection

DeepFake 检测

2

鲁棒序列检测、双级适配器检测

Cross-Modal

跨模态

2

跨模态蒸馏

1 研究热点词云图

表2列出了在本次会议中,被录用的38篇论文标题中的15个高频主题词。图1展示了基于IJCV研究热点生成的词云图,涵盖语义分割、扩散模型、一致性等研究领域。表3总结了本期IJCV的已被接受的投稿论文。

3 2025年5月IJCV发表论文的列表

题目

中文翻译

AutoStory: Generating Diverse Storytelling Images with Minimal Human Efforts

AutoStory:以最小人力生成多样化故事图像

SLIDE: A Unified Mesh and Texture Generation Framework with Enhanced Geometric Control and Multi-view Consistency

SLIDE:具有增强几何控制与多视角一致性的统一网格与纹理生成框架

Exploring Homogeneous and Heterogeneous Consistent Label Associations for Unsupervised Visible-Infrared Person ReID

探索同质与异质一致标签关联的无监督可见光–红外行人重识别

AniClipart: Clipart Animation with Text-to-Video Priors

AniClipart:基于文本到视频先验的剪贴画动画

Combating Label Noise with a General Surrogate Model for Sample Selection

使用通用替代模型进行样本选择以对抗标签噪声

CSFRNet: Integrating Clothing Status Awareness for Long-Term Person Re-identification

CSFRNet:融合服装状态感知的长时跨度行人重识别网络

Pseudo-Plane Regularized Signed Distance Field for Neural Indoor Scene Reconstruction

伪平面正则化签名距离场用于神经室内场景重建

RepSNet: A Nucleus Instance Segmentation Model Based on Boundary Regression and Structural Re-Parameterization

RepSNet:基于边界回归与结构重参数化的细胞核实例分割模型

Blind Image Quality Assessment: Exploring Content Fidelity Perceptibility via Quality Adversarial Learning

盲图像质量评估:通过质量对抗学习探索内容保真性感知

HUPE: Heuristic Underwater Perceptual Enhancement with Semantic Collaborative Learning

HUPE:基于语义协同学习的启发式水下感知增强

Robust Sequential DeepFake Detection

强健序列化 DeepFake 检测

PICK: Predict and Mask for Semi-supervised Medical Image Segmentation

PICK:用于半监督医学图像分割的预测与掩码方法

Relation-Guided Versatile Regularization for Federated Semi-Supervised Learning

基于关系引导的联邦半监督学习通用正则化

General Class-Balanced Multicentric Dynamic Prototype Pseudo-Labeling

通用类平衡多中心动态原型伪标签

Diving Deep into Simplicity Bias for Long-Tailed Image Recognition

深入探讨长尾图像识别中的简单性偏差

Context-Aware Multi-view Stereo Network for Efficient Edge-Preserving Depth Estimation

面向高效边缘保留深度估计的上下文感知多视角立体网络

LDTrack: Dynamic People Tracking by Service Robots Using Diffusion Models

LDTrack:服务机器人基于扩散模型的动态人群跟踪

Learning Meshing from Delaunay Triangulation for 3D Shape Representation

从 Delaunay 三角化学习网格以进行三维形状表示

RIGID: Recurrent GAN Inversion and Editing of Real Face Videos and Beyond

RIGID:真实人脸视频的循环 GAN 反演与编辑

UniCanvas: Affordance-Aware Unified Real Image Editing via Customized Text-to-Image Generation

UniCanvas:通过定制文本到图像生成功能感知的统一真实图像编辑

Generalized Robot Vision-Language Model via Linguistic Foreground-Aware Contrast

通过语言前景感知对比的通用机器人视觉-语言模型

Rethinking Generalizability and Discriminability of Self-Supervised Learning from Evolutionary Game Theory Perspective

从进化博弈论视角重新思考自监督学习的泛化性与判别性

Pre-trained Trojan Attacks for Visual Recognition

预训练木马攻击用于视觉识别

GL-MCM: Global and Local Maximum Concept Matching for Zero-Shot Out-of-Distribution Detection

GL-MCM:用于零样本分布外检测的全局与局部最大概念匹配

A Mutual Supervision Framework for Referring Expression Segmentation and Generation

一种用于指代表达式分割与生成的互监督框架

DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection

DeepFake-Adapter:用于 DeepFake 检测的双层适配器

MoonShot: Towards Controllable Video Generation and Editing with Motion-Aware Multimodal Conditions

MoonShot:面向可控视频生成与编辑的运动感知多模态条件

SeaFormer++: Squeeze-Enhanced Axial Transformer for Mobile Visual Recognition

SeaFormer++:用于移动视觉识别的压缩增强轴向 Transformer

Dual-Space Video Person Re-identification

双空间视频行人重识别

Image Synthesis Under Limited Data: A Survey and Taxonomy

有限数据条件下的图像合成:调查与分类

Sample-Cohesive Pose-Aware Contrastive Facial Representation Learning

基于样本内聚性与姿态感知的对比人脸表征学习

Learning with Enriched Inductive Biases for Vision-Language Models

面向视觉-语言模型的富归纳偏置学习

Self-supervised Shutter Unrolling with Events

基于事件的自监督快门反展开

TryOn-Adapter: Efficient Fine-Grained Clothing Identity Adaptation for High-Fidelity Virtual Try-On

TryOn-Adapter:用于高保真虚拟试穿的高效细粒度服装身份适配

Correction: CMAE-3D: Contrastive Masked AutoEncoders for Self-Supervised 3D Object Detection

勘误:CMAE-3D:用于自监督三维目标检测的对比掩码自编码器

Correction: Deep Attention Learning for Pre-operative Lymph Node Metastasis Prediction in Pancreatic Cancer via Multi-object Relationship Modeling

勘误:基于多目标关系建模的胰腺癌术前淋巴结转移预测深度注意力学习

Correction: Few Annotated Pixels and Point Cloud Based Weakly Supervised Semantic Segmentation of Driving Scenes

勘误:基于少量标注像素与点云的驾驶场景弱监督语义分割

投稿的论文主题反映出本期研究热点集中在一下几个方向:

  1. 图像/视频生成与编辑:包括故事图像生成(AutoStory)、文本到视频/图像生成(AniClipart、UniCanvas、MoonShot)、Diffusion Models 驱动的生成与编辑(LDTrack、RIGID)等。这一方向兼顾“多模态条件下的内容创生”和“运动感知的可控编辑”两大主题。
  2.  一致性建模与行人重识别:涉及多视角一致性(SLIDE)、可见-红外一致标签关联(Unsupervised Visible-Infrared Person ReID)、长时序状态感知重识别(CSFRNet)等。关注场景中跨视角、跨模态的一致性约束与特征对齐技术。
  3. 语义分割与三维重构:包括神经签名距离场重建(Pseudo-Plane Regularized SDF)、Delaunay三角网格重建(Learning Meshing from Delaunay Triangulation)、核实例分割(RepSNet)、弱监督/半监督分割(PICK、Few Annotated Pixels)等。兼顾平面、体素、点云等多种三维表示与精细分割任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/web/83139.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

互联网大厂Java求职面试:云原生与微服务架构的深度探讨

互联网大厂Java求职面试:云原生与微服务架构的深度探讨 第一轮提问 面试官: “郑薪苦,假设我们要设计一个大规模电商平台的微服务架构,你会如何设计其订单服务?” 郑薪苦: “首先,我会采用…

STM32实战:数字音频播放器开发指南

基于STM32的数字音频播放器/效果器是个很棒的项目!这涉及到多个嵌入式开发的关键技术点。下面我为你拆解实现方案和关键学习内容: 系统架构概览 [SD Card] -> [File System (FATFS)] -> [Audio Decoder (WAV/MP3)] -> [DSP Processing (EQ, R…

基于TurtleBot3在Gazebo地图实现机器人远程控制

1. TurtleBot3环境配置 # 下载TurtleBot3核心包 mkdir -p ~/catkin_ws/src cd ~/catkin_ws/src git clone -b noetic-devel https://github.com/ROBOTIS-GIT/turtlebot3.git git clone -b noetic https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone -b noetic-dev…

【Vue】scoped+组件通信+props校验

【scoped作用及原理】 【作用】 默认写在组件中style的样式会全局生效, 因此很容易造成多个组件之间的样式冲突问题 故而可以给组件加上scoped 属性, 令样式只作用于当前组件的标签 作用:防止不同vue组件样式污染 【原理】 给组件加上scoped 属性后…

IDEA 中 Maven Dependencies 出现红色波浪线的原因及解决方法

在使用 IntelliJ IDEA 开发 Java 项目时,尤其是基于 Maven 的项目,开发者可能会遇到 Maven Dependencies 中出现红色波浪线的问题。这种现象通常表示项目依赖未能正确解析或下载,导致代码提示错误、编译失败等问题。本文将详细分析该问题的常…

把二级域名绑定的wordpress网站的指定页面

要将二级域名(如 beijing.wodepress.com)绑定到 WordPress 网站的指定页面(如 wodepress.com/beijing),你需要完成以下步骤: 步骤 1:创建二级域名 登录你的域名控制面板(如 cPanel、阿里云、腾讯云等)。 找到 DNS 管理 或 域名解析 部分。…

FreeRTOS学习01_移植FreeRTOS到STM32(图文详解)

移植FreeRTOS到STM32 1、前言2、获取 STM32 的裸机工程模板3、下载 FreeRTOS V9.0.0 源码4、FreeRTOS文件夹内容简介5、移植FreeRTOS5.1 更改STM32工程模板文件夹名字5.2 提取FreeRTOS最简源码5.3 拷贝 FreeRTOSConfig.h 文件到 user 文件夹5.4 添加 FreeRTOS 源码到工程组文件…

12.找到字符串中所有字母异位词

🧠 题目解析 题目描述: 给定两个字符串 s 和 p,找出 s 中所有 p 的字母异位词的起始索引。 返回的答案以数组形式表示。 字母异位词定义: 若两个字符串包含的字符种类和出现次数完全相同,顺序无所谓,则互为…

基于Springboot+Vue的办公管理系统

角色: 管理员、员工 技术: 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能: 该办公管理系统是一个综合性的企业内部管理平台,旨在提升企业运营效率和员工管理水…

【磁盘】每天掌握一个Linux命令 - iostat

目录 【磁盘】每天掌握一个Linux命令 - iostat工具概述安装方式核心功能基础用法进阶操作实战案例面试题场景生产场景 注意事项 【磁盘】每天掌握一个Linux命令 - iostat 工具概述 iostat(I/O Statistics)是Linux系统下用于监视系统输入输出设备和CPU使…

专业文件比对辅助软件

软件介绍 本文介绍一款用于文件内容对比的计算机辅助工具,支持快速识别不同版本文档间的差异内容。 功能与版本特性 这款工具提供无偿使用授权,技术文档显示其开发历程已达近三十年。程序采用独立封装设计,无需安装即可直接运行。 基础操…

【时时三省】(C语言基础)变量的存储方式和生存期

山不在高,有仙则名。水不在深,有龙则灵。 ----CSDN 时时三省 动态存储方式与静态存储方式 从变量的作用域(即从空间)的角度来观察,变量可以分为全局变量和局部变量。 还可以从另一个角度,即从变量值存在…

记录:外扩GPIOD访问报警告

rk提供的rfkill-bt.c驱动访问外扩GPIO输出如下警告: [ 4.694993] ------------[ cut here ]------------ [ 4.694994] WARNING: CPU: 7 PID: 582 at drivers/gpio/gpiolib.c:2805 gpiod_get_raw_value0x58/0xd4 [ 4.695003] Modules linked in: [ 4.69…

LangChain面试内容整理-知识点4:工具(Tool)机制与实现

在LangChain中,工具(Tool)是智能体(Agent)、链(Chain)或LLM可以调用的外部函数接口。可以将Tool理解为LLM可以使用的能力或插件:通过调用工具,LLM能够获取额外的信息或执行特定的动作,比如查询数据库、搜索互联网、做数学计算等comet.compinecone.io。工具赋予了LLM交…

GraphQL 实战篇:Apollo Client 配置与缓存

GraphQL 实战篇:Apollo Client 配置与缓存 上一篇:GraphQL 入门篇:基础查询语法 依旧和上一篇的笔记一样,主实操,没啥过多的细节讲解,代码具体在: https://github.com/GoldenaArcher/graphql…

web3-基于贝尔曼福特算法(Bellman-Ford )与 SMT 的 Web3 DeFi 套利策略研究

web3-基于贝尔曼福特算法(Bellman-Ford )与 SMT 的 Web3 DeFi 套利策略研究 如何找到Defi中的交易机会 把defi看做是一个完全开放的金融产品图表,可以看到所有的一切东西;我们要沿着这些金融图表找到一些最优的路径,就…

SQL Server 触发器调用存储过程实现发送 HTTP 请求

文章目录 需求分析解决第 1 步:前置条件,启用 OLE 自动化方式 1:使用 SQL 实现启用 OLE 自动化方式 2:Sql Server 2005启动OLE自动化方式 3:Sql Server 2008启动OLE自动化第 2 步:创建存储过程第 3 步:创建触发器扩展 - 如何调试?第 1 步:登录 SQL Server 2008第 2 步…

Go 语言中的内置运算符

1. 算术运算符 注意: (自增)和--(自减)在 Go 语言中是单独的语句,并不是运算符。 package mainimport "fmt"func main() {fmt.Println("103", 103) // 13fmt.Println("10-3…

SQL注入篇-sqlmap的配置和使用

在之前的皮卡丘靶场第五期SQL注入的内容中我们谈到了sqlmap,但是由于很多朋友看不了解命令行格式,所以是纯手动获取数据库信息的 接下来我们就用sqlmap来进行皮卡丘靶场的sql注入学习,链接:https://wwhc.lanzoue.com/ifJY32ybh6vc…

发立得信息发布系统房屋信息版(php+mysql)V1.0版

# 发立得信息发布系统房屋信息版(phpmysql) 一个轻量级的房屋信息发布平台,基于PHP和MySQL开发,支持用户发布房屋出售/出租信息,以及后台管理功能。 轻量级适合网站开发PHP方向入门者学习,首发版本,未经实际业务流程检…