OpenCV阈值处理完全指南:从基础到高级应用

引言

阈值处理是图像处理中最基础、最常用的技术之一,它能够将灰度图像转换为二值图像,为后续的图像分析和处理奠定基础。本文将全面介绍OpenCV中的各种阈值处理方法,包括原理讲解、代码实现和实际应用场景。

一、什么是阈值处理?

阈值处理(Thresholding)是通过设定一个或多个阈值,将图像的像素值分为若干类的过程。对于灰度图像,通常是选择一个阈值,将像素分为"黑"和"白"两类,从而创建二值图像。

数学表达式:

dst(x,y) = maxVal if src(x,y) > thresh= 0      otherwise

二、OpenCV中的阈值处理函数

OpenCV提供了cv2.threshold()函数用于基本的阈值处理,其函数原型为:

retval, dst = cv2.threshold(src, thresh, maxval, type[, dst])

参数说明:

  • src:输入图像(必须为灰度图)
  • thresh:阈值
  • maxval:当像素值超过阈值时赋予的最大值
  • type:阈值类型
  • retval:实际使用的阈值(某些方法会自动计算)
  • dst:输出图像

三、5种基本阈值处理方法

1. 二进制阈值化(THRESH_BINARY)

import cv2
import numpy as npimg = cv2.imread('image.jpg', 0)  # 以灰度模式读取
ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

效果:像素值>127设为255,否则设为0

2. 反二进制阈值化(THRESH_BINARY_INV)

ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)

效果:与THRESH_BINARY相反

3. 截断阈值化(THRESH_TRUNC)

ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)

效果:像素值>127设为127,否则保持不变

4. 阈值化为0(THRESH_TOZERO)

ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)

效果:像素值>127保持不变,否则设为0

5. 反阈值化为0(THRESH_TOZERO_INV)

ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)

效果:与THRESH_TOZERO相反

四、自适应阈值处理

当图像光照不均时,全局阈值效果不佳,此时可以使用自适应阈值:

thresh = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY, 11, 2)

参数说明:

  • adaptiveMethod:自适应方法
    • ADAPTIVE_THRESH_MEAN_C:邻域均值
    • ADAPTIVE_THRESH_GAUSSIAN_C:邻域加权和(高斯)
  • blockSize:邻域大小(奇数)
  • C:从均值或加权和中减去的常数

五、Otsu’s二值化(大津算法)

对于双峰图像(直方图有两个明显峰值),Otsu方法可以自动确定最佳阈值:

ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)

六、实际应用案例

1. 文档扫描与OCR预处理

def preprocess_for_ocr(image_path):img = cv2.imread(image_path, 0)# 使用Otsu方法自动阈值化_, thresh = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)# 去噪kernel = np.ones((3,3), np.uint8)processed = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=1)return processed

2. 工业检测中的缺陷识别

def detect_defects(reference_img, test_img):# 转换为灰度图ref_gray = cv2.cvtColor(reference_img, cv2.COLOR_BGR2GRAY)test_gray = cv2.cvtColor(test_img, cv2.COLOR_BGR2GRAY)# 计算差异diff = cv2.absdiff(ref_gray, test_gray)# 自适应阈值处理thresh = cv2.adaptiveThreshold(diff, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY, 11, 2)# 寻找轮廓contours, _ = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)# 绘制缺陷区域result = test_img.copy()for cnt in contours:if cv2.contourArea(cnt) > 10:  # 忽略小面积x,y,w,h = cv2.boundingRect(cnt)cv2.rectangle(result, (x,y), (x+w,y+h), (0,0,255), 2)return result

七、阈值处理的高级技巧

1. 多阈值处理

def multi_threshold(image):gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)# 定义三个阈值_, th1 = cv2.threshold(gray, 50, 255, cv2.THRESH_BINARY)_, th2 = cv2.threshold(gray, 100, 255, cv2.THRESH_BINARY)_, th3 = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY)# 组合结果result = np.zeros_like(gray)result[(gray >= 0) & (gray < 50)] = 0result[(gray >= 50) & (gray < 100)] = 100result[(gray >= 100) & (gray < 150)] = 200result[gray >= 150] = 255return result

2. 基于HSV空间的阈值处理

def hsv_threshold(image):hsv = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)# 定义颜色范围(示例:红色)lower_red = np.array([0, 120, 70])upper_red = np.array([10, 255, 255])mask1 = cv2.inRange(hsv, lower_red, upper_red)lower_red = np.array([170, 120, 70])upper_red = np.array([180, 255, 255])mask2 = cv2.inRange(hsv, lower_red, upper_red)# 合并maskmask = mask1 + mask2# 应用maskresult = cv2.bitwise_and(image, image, mask=mask)return result

八、性能优化

性能优化建议:

  1. 对小图像使用全局阈值,对大图像使用自适应阈值
  2. 在循环中处理视频帧时,预先转换为灰度图
  3. 合理选择blockSize(通常11-31之间的奇数)

九、总结

阈值处理是图像分割和特征提取的基础,掌握各种阈值处理方法能够为更复杂的计算机视觉任务打下坚实基础。本文介绍了OpenCV中的基本阈值处理方法、自适应阈值和大津算法,并提供了实际应用案例和高级技巧。希望通过本文的学习,您能够根据不同的应用场景选择合适的阈值处理方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/905822.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java8到24新特性整理

本文整理了 Java 8 至 Java 24 各版本的新特性&#xff0c;内容包括每个版本的新增功能分类&#xff08;如语法增强、性能优化、工具支持等&#xff09;、详细的代码示例&#xff0c;并结合官方文档资料&#xff0c;分析每项特性的应用场景及优缺点。Java 8 发布于 2014 年&…

轮询仲裁器

参考视频 https://www.bilibili.com/video/BV1VQ4y1w7Rr/?spm_id_from333.337.search-card.all.click&vd_sourceaedd69dc9740e91cdd85c0dfaf25304b 算法原理

Armijo rule

非精线搜索步长规则Armijo规则&Goldstein规则&Wolfe规则_armijo rule-CSDN博客 [原创]用“人话”解释不精确线搜索中的Armijo-Goldstein准则及Wolfe-Powell准则 – 编码无悔 / Intent & Focused

力扣HOT100之二叉树:102. 二叉树的层序遍历

这道题太简单了&#xff0c;相当于基础的模板题&#xff0c;但凡涉及到层序遍历一定会用到队列来实现&#xff0c;其他的倒没啥好说的&#xff0c;用两层while循环来层序遍历&#xff0c;外层while循环用于控制访问二叉树的每一层&#xff0c;而内层while循环则负责收割每一层的…

Ubuntu24.04 安装 5080显卡驱动以及cuda

前言 之前使用Ubuntu22.04版本一直报错,然后换了24.04版本才能正常安装 一. 配置基础环境 Linux系统进行环境开发环境配置-CSDN博客 二. 安装显卡驱动 1.安装驱动 按以下步骤来&#xff1a; sudo apt update && sudo apt upgrade -y#下载最新内核并安装 sudo add…

WAS和Tomcat的对比

一、WAS和Tomcat的对比 WebSphere Application Server (WAS) 和 Apache Tomcat 是两款常用的 Java 应用服务器&#xff0c;但它们有许多显著的区别。在企业级应用中&#xff0c;它们扮演不同的角色&#xff0c;各自有其特点和适用场景。以下是它们在多个维度上的详细对比&…

asp.net IHttpHandler 对分块传输编码的支持,IIs web服务器后端技术

IHttpHandler&#xff0c;不支持分块传输编码&#xff08;Chunked Transfer&#xff09;吧&#xff1f; IHttpHandler 对分块传输编码的支持 实际上&#xff0c;IHttpHandler 完全支持分块传输编码&#xff08;Chunked Transfer Encoding&#xff09;&#xff0c;但具体行为取…

为什么elasticsearch配置文件JVM配置31G最佳

Elasticsearch的JVM堆内存配置为32GB被视为最佳实践&#xff0c;主要基于以下综合技术原理和性能优化考量&#xff1a; 1. ‌JVM指针压缩机制优化内存效率‌ 当堆内存≤32GB时&#xff0c;JVM启用‌对象指针压缩&#xff08;Compressed Ordinary Object Pointers, COOP&#…

Systemd基础

1. 概述 Systemd 是一系列工具的集合&#xff0c;其作用也远远不仅是启动操作系统&#xff0c;它还接管了后台服务、结束、状态查询&#xff0c;以及日志归档、设备管理、电源管理、定时任务等许多职责&#xff0c;并支持通过特定事件&#xff08;如插入特定 USB 设备&#xf…

AI预测3D新模型百十个定位预测+胆码预测+去和尾2025年5月16日第79弹

从今天开始&#xff0c;咱们还是暂时基于旧的模型进行预测&#xff0c;好了&#xff0c;废话不多说&#xff0c;按照老办法&#xff0c;重点8-9码定位&#xff0c;配合三胆下1或下2&#xff0c;杀1-2个和尾&#xff0c;再杀6-8个和值&#xff0c;可以做到100-300注左右。 (1)定…

CentOS高手之路:从进阶实战到企业级优化

一、系统深度优化与性能调优 1. 内核参数调优 通过修改/etc/sysctl.conf文件调整内核参数&#xff0c;可显著提升服务器性能。例如&#xff1a; net.ipv4.tcp_fin_timeout30&#xff08;快速释放TCP连接&#xff09; vm.swappiness10&#xff08;减少交换分区使用&#xff0…

Docker 无法拉取镜像解决办法

问题 在linux终端中通过 docker pull 命令拉取镜像&#xff0c;报错无法拉取镜像&#xff0c;这是因为 Docker 客户端无法连接到 Docker 镜像仓库&#xff08;Docker Hub&#xff09; 解决方法 1、配置国内可用的 Docker镜像加速器&#xff0c;这些镜像加速器用于提高从Docke…

【Linux】序列化与反序列化、会话与进程组、守护进程

一.序列化和反序列化 协议其实就是结构化的数据。但是再网络通信中&#xff0c;我们不直接发送结构化的数据给对方。我们一般会将结构化的数据序列化成字符串/字节流&#xff0c;然后通过网络在发送出去。而接收方收到之后&#xff0c;要对收到的字符串/流式数据进行反序列化&…

提权脚本Powerup命令备忘单

1. 获取与加载 从 GitHub 下载&#xff1a;(New-Object Net.WebClient).DownloadFile("https://raw.githubusercontent.com/PowerShellMafia/PowerSploit/master/Privesc/PowerUp.ps1", "C:\Temp\PowerUp.ps1")本地加载&#xff1a;Import-Module .\Power…

2025年Ai写PPT工具推荐,这5款Ai工具可以一键生成专业PPT

上个月给客户做产品宣讲时&#xff0c;我对着空白 PPT 页面熬到凌晨一点&#xff0c;光是调整文字排版就改了十几版&#xff0c;最后还是被吐槽 "内容零散没重点"。后来同事分享了几款 ai 写 PPT 工具&#xff0c;试完发现简直打开了新世界的大门 —— 不用手动写大纲…

部署docker上的redis,idea一直显示Failed to connect to any host resolved for DNS name

参考了https://blog.csdn.net/m0_74216612/article/details/144145127 这篇文章&#xff0c;关闭了centos的防火墙&#xff0c;也修改了redis.conf文件&#xff0c;还是一直显示Failed to connect to any host resolved for DNS name。最终发现是腾讯云服务器那一层防火墙没…

QML元素 - OpacityMask

QML 的 OpacityMask 用于通过遮罩元素的 透明度&#xff08;Alpha 通道&#xff09; 裁剪源元素的可见区域&#xff0c;适用于创建不规则形状的 UI 元素&#xff08;如圆形头像、波浪形进度条&#xff09;或复杂视觉效果。以下是详细使用技巧和常见场景示例&#xff1a; 1. 基本…

麒麟桌面系统文件保险箱快捷访问指南:让重要文件夹一键直达桌面!

往期文章链接&#xff1a;统信操作系统自定义快捷键配置音量调节功能指南 Hello&#xff0c;大家好啊&#xff0c;今天给大家带来一篇麒麟桌面操作系统上配置文件保险箱内文件夹桌面快捷方式的文章&#xff0c;欢迎大家分享点赞&#xff0c;点个在看和关注吧&#xff01;在日常…

LLM笔记(三)位置编码(1)

位置编码理论与应用 1. 位置编码如何解决置换不变性及其数学表现 在Transformer模型中&#xff0c;自注意力机制&#xff08;Self-Attention&#xff09;具有置换不变性&#xff08;permutation invariance&#xff09;&#xff0c;这意味着对输入序列的词元&#xff08;toke…

在人脸识别项目中ffmpeg有什么作用

在人脸识别项目中&#xff0c;FFmpeg 主要用于处理视频文件或流媒体数据。尽管 FFmpeg 本身并不是直接用于人脸识别的工具&#xff0c;但它通过其强大的多媒体处理能力&#xff0c;在很多方面间接支持了人脸识别任务的执行。以下是 FFmpeg 在人脸识别项目中的几个主要作用&…