图像质量评价(Image Quality Assessment,IQA)

文章目录

  • 图像质量评价(Image Quality Assessment,IQA)
  • 一、评估方式:主观评估 + 客观评估
    • 1.1、主观评估方式
    • 1.2、客观评估方式:全参考 + 半参考 + 无参考
      • (1)全参考的方法对比(Full-Reference IQA,FR-IQA)
      • (2)半参考的方法对比(Reduced-Reference IQA,RR-IQA)
      • (3)无参考的方法对比(No-Reference / Blind IQA,NR-IQA)
    • 1.3、常用公开IQA数据集对比表

图像质量评价(Image Quality Assessment,IQA)

图像质量评价指标(Image Quality Assessment, IQA)是衡量图像在主观感受或客观性能上的一组量化标准,常用于图像增强、压缩、重建、去噪等任务的效果评估。

图像质量评估:维基百科
图像质量评价:百度百科
图像质量评价(每个方法的论文简介与链接)

图像质量评估综述

  • 质量评估可分为:
    • 图像质量评估IQA
    • 视频质量评估VQA
  • IQA方法从宏观上可分为:
    • 主观评价:依赖人工评分,尽管准确性高、符合人眼视觉系统(HVS)偏好,但成本昂贵、效率低下,难以适配大规模自动化系统。
    • 客观评价:则以数学模型自动预测图像质量,广泛应用于工业与科研领域,是当前主流研究方向。
  • 从参考图像可用性角度,IQA又分为三类:
    • FR-IQA(全参考):借助无失真参考图像,计算其与原始图像的差异方法成熟、性能稳定,但对实际应用受限(因多数情况下参考图像缺失)。
    • RR-IQA(半参考):只有原始图像的部分信息或从参考图像中提取的部分特征在性能与适用性之间折中。
    • NR-IQA(无参考):仅依赖待评估图像本身,不需要参考图像应用最广但难度最大,当前是研究热点。

一、评估方式:主观评估 + 客观评估

评估方式简介特点与对比维度
主观评估(Subjective IQA)基于真实观察者的视觉感知,由人类主观对图像质量进行评分,常用指标包括MOS(平均意见得分)与DMOS(差异意见得分)。需要通过标准化实验环境和统计方法获取大量人评分。- ✅ 精度最高,最符合人眼感知
- ❌ 可复现性差,结果易受主观因素干扰
- ❌ 成本高,需招募被试并控制实验环境
- ❌ 实时性差,无法快速得出结果
- ❌ 难以部署,通常用于数据库标注与模型基准
客观评估(Objective IQA)通过数学模型或算法自动估算图像质量分数,目标是尽可能逼近主观得分,具有可重复性和实时性。根据参考图像的使用程度分为FR(全参考)、RR(半参考)、NR(无参考)三类,是当前研究热点。- ✅ 可复现、稳定性强
- ✅ 成本低,自动处理大规模图像
- ✅ 实时性好,支持在线或终端部署
- ✅ 可广泛应用于图像压缩、增强、采集质量控制等场景
- ⚠ 精度依赖模型质量,NR方法尤其具有挑战性

1.1、主观评估方式

方法类型简要说明评分输出应用场景
MOS(平均意见得分)多人打分后取平均分1 ~ 5 或 0 ~ 100训练NR-IQA模型,构建图像质量数据集
DMOS(差分MOS)与原始图像评分的差值,反映质量劣化程度通常为正数TID2013、CSIQ等主观差分数据集
单刺激法(SS)仅展示失真图像进行评分相对主观KonIQ-10k, LIVE Wild等
双刺激法(DSCQS)参考图与失真图并排显示,受试者对失真程度打分相对准确LIVE、CSIQ、TID系列
三选一法(3AFC)三图中选出质量最好/最差者,构建排序关系用于学习构造对比样本对DeepIQA排序训练等

1.2、客观评估方式:全参考 + 半参考 + 无参考

类别全称(英文)是否需要参考图像输入信息输出结果代表算法/模型常见评价指标常用数据集优势描述劣势描述典型应用场景
FR-IQAFull Reference IQA✅ 全参考原图 + 失真图两图之间的相似性得分PSNR、SSIM、MS-SSIM、FSIM、VIFPSNR, SSIM, MSELIVE, TID2013, CSIQ, KADID-10k精度高,计算逻辑清晰,结果可对齐主观感知依赖原图,实际部署难编解码优化、图像增强算法调试
RR-IQAReduced Reference IQA✅ 半参考失真图 + 原图特征或统计量与参考特征的相似性得分RRED、DNT、NRQM(部分)JS差异, KL散度, 差值指标TID2013, LIVE, SIQAD节省传输成本,精度优于NR,兼顾应用性与性能仍需传输部分特征,模型通用性不足视频传输评估、带宽受限下的图像监控
NR-IQANo Reference IQA / Blind IQA❌ 无参考单张失真图图像质量得分(预测值)BRISQUE、NIQE、PIQE、DeepBIQ、HyperIQA等MOS(主观分数)KonIQ-10k, SPAQ, CLIVE, LIVE Wild无需参考图,可用于实际图像质量预测部署难以保证泛化能力,训练依赖主观评分数据集医疗图像质检、无人监督场景

(1)全参考的方法对比(Full-Reference IQA,FR-IQA)

方法名核心指标是否模型训练主要思想优点缺点适用场景
MSE / PSNR均方误差 / 峰值信噪比逐像素差异/误差量度简单高效,便于实现不符合人眼感知;不具备感知鲁棒性压缩、编码等低层处理
SSIM结构相似度 Structural Similarity考察亮度、对比度与结构信息模拟视觉机制,感知一致性更好对几何变化、伪影不敏感编解码质量评估
MS-SSIM多尺度结构相似度多分辨率层次感知更贴近人眼感知层级计算略复杂高清视频/图像质量评价
VIF信息保真度 Visual Information Fidelity源图像/失真图像的信息量比率信息论基础,评价可靠性高理论复杂,耗时较长图像传输、压缩失真评估
FSIM特征相似度 Feature SIM考察相位一致性、梯度强度敏感性高,鲁棒性好不适合大规模计算图像增强质量评价
LPIPS感知相似度 Learned Perceptual Image Patch Similarity是(深度模型)提取CNN特征后计算相似度感知特性强,视觉一致性高模型依赖重、需GPU超分辨、风格迁移、图像复原等任务

(2)半参考的方法对比(Reduced-Reference IQA,RR-IQA)

方法名参考特征类型是否训练模型方法特点优点缺点适用场景
RRED局部统计量(DCT能量特征)基于变换域的熵率与视觉冗余度估计精度高,接近FR-IQA特征提取依赖参考图像,计算复杂通信系统图像质量反馈
DNT-RRDCT统计特征仅传输部分统计特征用于质量预测传输代价低,可嵌入实际系统失真类型覆盖范围有限网络图像编码传输
Wavelet-Q小波能量子带统计量局部频域统计特征构建质量指标可解释性强,计算高效对某些失真鲁棒性不足通信协议/嵌入式视频传输
RR-FSIM相位一致性+幅度统计特征对FSIM简化,只提取部分参考特征接近FR精度,传输成本低对特征选择依赖高视频会议、直播质量评估
RR-NSS自然场景统计参数利用自然图像统计模型压缩参考图像信息适应性强不适合非自然图像工业检测、远程图像识别等场景

(3)无参考的方法对比(No-Reference / Blind IQA,NR-IQA)

🚀 NR-IQA研究现状

  • 传统统计方法阶段(2010年以前)
    代表方法如BIQI、DIIVINE、BRISQUE等,依赖自然图像统计(NSS)特征,使用SVM或贝叶斯回归模型实现质量预测。该阶段研究具有可解释性强、计算代价低等优点,但泛化能力有限。
  • 数据驱动阶段(2013年起)
    随着深度学习发展,基于CNN的NR-IQA方法如CORNIA、NIMA、DeepBIQ等不断涌现,能够从图像中自动学习判别特征,主观一致性显著提升。此类方法在主观评分预测、跨数据库泛化等方面取得较好效果,但对数据依赖严重、可解释性差。
  • Transformer与自监督阶段(2020年至今)
    新一代方法引入Vision Transformer结构(如MANIQA、TReS、MUSIQ)或自监督学习(如CONTRIQUE),提升跨场景泛化能力与语义建模能力。当前最先进模型普遍在多个公开数据集(如LIVE、TID2013、KonIQ-10k、CLIVE等)上取得了优异成绩,开始接近甚至超过主观一致性下限。
方法名称首次提出模型类型特征类型是否训练适用失真类型主观一致性优点局限性应用场景
NIQE (Natural Image Quality Evaluator)2013传统统计模型NSS(自然场景统计)泛化失真(无需训练数据)中等无需训练、计算高效对特定失真不敏感,主观一致性不高快速筛选、质量控制
BRISQUE (Blind/Referenceless Image Spatial Quality Evaluator)2012SVM回归NSS特征(空域)模糊、压缩等常见失真轻量级、主观一致性较高需训练样本,失真类型受限通用图像评估
BLIINDS-II (Blind Image Integrity Notator using DCT Statistics)2011贝叶斯回归NSS(频域DCT)模糊、噪声等中等频域分析精细提取DCT特征耗时、训练依赖性视频压缩质量监测
CORNIA (Codebook Representation for No-Reference IQA)2013机器学习原始图块+无监督特征学习多种失真结合深层表示对内容敏感,训练成本高图像增强前后质量评估
HOSA (Higher Order Statistics Aggregation)2015无监督统计特征聚合(SVD+高阶矩)各类失真无需深度网络,适应性强参数敏感,训练集依赖医学图像质量分析
DIIVINE2011SVMNSS(空间+小波域)多类失真空间-频域联合特征维度高,训练成本大图像处理算法评估
IL-NIQE2015无监督NSS + 亮度不变性各类失真中等无训练集依赖,稳定性强泛化能力有限嵌入式图像监控设备
NIMA (Neural Image Assessment)2017CNN回归全图输入(Inception)主观美学/质量可预测MOS分布,美学兼顾训练代价高图像美学质量评分
DeepBIQ2016CNN分类+回归局部图块+深度特征泛化强利用深层特征,有效预测黑盒问题,计算量大手机拍照图像优化
RankIQA2017Siamese网络Siamese排序特征多类失真模拟评分过程,更接近人感知排序数据构建复杂图像优化排序任务
DBCNN2018CNN分类回归VGG16 + 评分网络各类失真精度高,可回归MOS需要大量数据通用图像质量评分
CONTRIQUE2021Transformer+NSSNSS嵌入 + 自监督学习泛化失真(无监督)利用NSS嵌入鲁棒性强网络复杂零样本质量估计
MANIQA2022Vision Transformer局部块 + 全局注意力泛化强极高高分辨率支持,跨数据集表现好模型参数多高端视觉质量分析

1.3、常用公开IQA数据集对比表

数据集名称类型图像数(参考/失真)失真类型主观评分特点简介
LIVE [官网]FR-IQA29 / 779模糊、压缩、噪声、快门抖动等5类DMOS最早最广泛使用的数据集之一;包含真实失真与评分,广泛用于FR-IQA评估基准。
CSIQ [官网]FR-IQA30 / 8666类失真×不同强度DMOS图像与失真类型更丰富;主观得分离散性较小;与LIVE互补。
TID2013 [官网]FR-IQA25 / 300024种失真×5级强度MOS非常全面的数据集;失真种类多,适合训练与泛化测试。
TID2008FR-IQA25 / 170017类失真MOSTID2013前身,失真较少但结构相似。
KADID-10k [官网]FR-IQA81 / 10,12525类失真×不同强度MOS图像种类多、失真复杂,适合深度学习模型训练。
CID2013FR-IQA474 / 474实拍设备失真MOS强调真实场景采集(拍照质量);图像尺寸大,适合真实感知建模。
Waterloo IAA [官网]FR-IQA4744 / 94,880常见压缩与噪声等失真无主观得分用于无参考方法的无监督训练或构造合成失真;大规模。
KonIQ-10k [官网]NR-IQA— / 10,073自然图像,真实失真MOS高分辨率自然图像;图像来源广泛,适合NR-IQA训练;包含多维质量因子标注。
CLIVE [官网]NR-IQA— / 1,162拍摄图像中自然失真MOS强调移动端/手持拍摄自然图像质量;适合盲质量评价建模。
SPAQ [论文]NR-IQA— / 11,125高质量自然失真图像MOS更具挑战性,真实感强;含曝光/色彩/对比等因素。
FLIVENR-IQA— / 39,000+自然采集图像MOS最大规模真实图像质量数据集之一,适用于深度NR-IQA模型训练。

📌 说明:

  • FR-IQA(Full Reference):提供参考图像与失真图像,可用于全参考算法对比。
  • NR-IQA(No Reference):无参考图像,难度更高,适合实际部署情境。
  • MOS/DMOS:主观评分标准,分别代表“平均意见分数”“差异平均意见分数”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/89294.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/89294.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【跟我学YOLO】(2)YOLO12 环境配置与基本应用

欢迎关注『跟我学 YOLO』系列 【跟我学YOLO】(1)YOLO12:以注意力为中心的物体检测 【跟我学YOLO】(2)YOLO12 环境配置与基本应用 【跟我学YOLO】(3)YOLO12 用于诊断视网膜病变 【跟我学YOLO】&a…

Python爬虫实战:研究openpyxl库相关技术

1. 引言 在当今数字化时代,互联网上蕴含着海量有价值的数据。如何高效地获取这些数据并进行分析处理,成为数据科学领域的重要研究方向。网络爬虫作为一种自动化的数据采集工具,可以帮助我们从网页中提取所需的信息。而 openpyxl 作为 Python 中处理 Excel 文件的优秀库,能…

Redis学习其一

文章目录1.NoSQL概述1.1概述1.2Nosql的四大分类2.Redis入门2.1概述2.2基础知识2.2.1基础命令/语法2.2.2Redis为什么单线程还这么快2.3性能测试3.五大数据类型3.1Redis-key3.2String(字符串)3.3List(列表)3.4Set(集合)3.5Hash(哈希)3.6Zset(有…

高性能架构模式——高性能缓存架构

目录 一、引入前提二、缓存架构的设计要点2.1、缓存穿透2.1.1、缓存穿透第一种情况:存储数据不存在2.1.2、缓存穿透第二种情况:缓存数据生成耗费大量时间或者资源2.2、缓存雪崩2.2.1、解决缓存雪崩的第一种方法:更新锁机制2.2.2、解决缓存雪崩的第二种方法:后台更新机制2.3…

ubuntu+windows双系统恢复

文章目录前言一、恢复windows1.直接在grub命令行输入exit退出2.手动查找windows引导文件先ls列出所有磁盘和分区查找各个分区是否包含引导文件设置引导分区以及引导文件路径启动windows二、在windows系统下删除Ubuntu残留引导文件三、准备ubuntu系统引导盘四、安装ubuntu系统五…

使用Dify构建HR智能助理,深度集成大模型应用,赋能HR招聘管理全流程,dify相关工作流全开源。

HR智能助理系统 📋 项目概述 HR智能助理系统是一个基于AI技术的人力资源管理平台,旨在通过智能化工具提升招聘效率,优化候选人评估流程,并提供专业的面试方案生成服务。 🎯 核心价值 提升招聘效率60%:自动化…

PowerBI实现仅在需要图表时显示图表

PowerBI实现仅在需要图表时显示图表实现效果点击维度前:点击维度后:实现步骤第一步,先创建一个矩阵表和一个柱形图第二步,添加一个新卡片图第三步,创建文本度量值Text "⭠ 选择一个地区"第四步,创…

信息收集知识总结

信息收集 在信息收集中,需要收集的信息:目标主机的DNS信息、目标IP地址、子域名、旁站和C段、CMS类型、敏感目录、端口信息、操作系统版本、网站架构、漏洞信息、服务器与中间件信息、邮箱、人员、地址等。 域名信息收集 拿到公司名或者一个域名&…

工作第一步建立连接——ssh

照本宣科 SSH(Secure Shell,安全外壳协议)是一种用于在不安全网络上进行安全远程登录和实现其他安全网络服务的协议.功能主要是远程登陆和文件传输(使用scp) 为了建立 SSH 远程连接,需要两个组件&#xf…

Markdown变身Word,解锁格式转换新姿势

目录一、引言二、在线转换工具使用法2.1 工具推荐2.2 操作步骤2.3 优缺点分析三、文本编辑器的内置功能或插件3.1 适用编辑器列举3.2 以 Visual Studio Code 为例的操作流程3.3 优势说明四、使用专门的转换软件4.1 Pandoc 软件介绍4.2 安装步骤4.3 命令行转换操作五、编程脚本实…

MR 处于 WIP 状态的WIP是什么

WIP是什么 在MR(Merge Request 或代码合并请求)中,WIP 是"Work In Progress" 的缩写,意思是“正在进行中”或“在制品”。当一个MR 被标记为WIP,通常表示它尚未准备好被合并,可能还在开发中&…

机器学习-线性回归模型和梯度算法

1. 线性回归模型1.1 线性回归模型线性回归模型:将数据拟合成一条直线。作用:预测数字作为输出。例子:房子的大小与房价的估计(图表)(数据表)1.2 训练集训练集:用于训练模型的数据集训…

时序预测 | Matlab代码实现VMD-TCN-GRU-MATT变分模态分解时间卷积门控循环单元多头注意力多变量时序预测

预测效果代码功能 代码主要功能 该代码实现了一个变分模态分解时间卷积门控循环单元多头注意力多变量时间序列预测模型,核心功能为: 使用VMD(变分模态分解)将原始信号分解为多个IMF分量对每个IMF分量构建TCN-GRU-MATT混合神经网络…

HTML5 离线存储

HTML5 离线存储(通常指 Application Cache)是早期用于实现 Web 应用离线访问的技术,但由于其设计缺陷已被废弃。现代 Web 开发中,取而代之的是更强大的 Service Worker Cache API 方案(属于 Progressive Web Apps 技术…

JavaScript 性能优化实战:深入性能瓶颈,精炼优化技巧与最佳实践

前言 现代前端开发,不仅要“能跑”,更要“跑得快”。在用户体验为王的时代,JavaScript 性能优化已经成为前端工程师的必修课。 为什么要关注 JavaScript 性能 加载缓慢 → 用户流失卡顿滞后 → 交互体验崩溃资源浪费 → 设备电量与内存被吞…

文心4.5开源背后的战略棋局:百度为何选择All in开放?

文章目录引言:一场颠覆AI行业格局的孤注国内开源模型的崛起与威胁国际竞争格局的重塑1.技术维度:开源是突破模型性能瓶颈的“加速器”1.1 闭源模型的“内卷化”困境1.2 文心4.5的开源技术架构:从“黑箱”到“乐高”1.2.1文心4.5的技术创新1.2…

SAP学习笔记 - 开发46 - RAP开发 Managed App Metadata Extension 2 - Booking_M,BookSuppl_M

上一章讲了 RAP开发中,New Service Definition,Metadata Extension,在Metadata 文件中 复习了 lineItem,selectionField,Search,ObjectModel,Value Help,headerInfo 等内容。 SAP学…

# Win11开机卡死?无法进入登录界面?3招强制进安全模式,快速修复系统

Win11开机卡死?无法进入登录界面?3招强制进安全模式,快速修复系统一、问题描述: 当你的win11电脑开机后卡在图片界面就死机,无法进入登录界面,不显示windows徽标,不能正常启动,可能的…

快捷支付与网关支付:两种主流支付方式的深度解析

在当今数字化支付时代,快捷支付和网关支付作为两种主流的电子支付方式,为消费者和商家提供了多样化的支付选择。本文将深入探讨这两种支付方式的区别、适用场景及各自的优劣势,帮助您更好地理解现代支付生态。一、快捷支付:便捷高…

【WRFDA数据教程第一期】LITTLE_R 格式详细介绍

目录LITTLE_R 格式概述LITTLE_R 的结构1-Header Record 详解:观测的“身份证”2-Data Record:观测数据本体3-Ending Record:终止标志4-Tail Integers:尾部校验字段另-Missing Values(缺测值处理)Mandatory,…