opencv + jpeg_turbo(启用SIMD加速)

背景

opencv的imread+imwrite耗时过大
一张5M的图片读用了140ms,写一张1.7M的图片用149ms

  1. 平台:mingw64编译Windows程序
  2. 版本:opencv4.5.4

加速方案

  1. opencv启用openmp
  2. opencv启用jpeg_turbo
  3. jpeg_turbo启动SIMD加速

下载jpeg_turbo源码

opencv源码自带的jpeg_turbo源码不支持SIMD配置的,需要自己重新下载源码

版本确定:

opencv-4.5.4\3rdparty\libjpeg-turbo\CMakeLists.txt
set(VERSION_MAJOR 2)
set(VERSION_MINOR 1)
set(VERSION_REVISION 0)
所以opnecv4.5.4使用的是libjpeg-turbo v2.1.0

下载源码

git clone https://github.com/libjpeg-turbo/libjpeg-turbo.git -b 2.1.0

编译

  1. libjpeg-turbo的SIMD加速依赖NASM处理汇编代码
# 在MSYS2终端中执行
pacman -S nasm
  1. 配置CMake参数
mkdir build_mingw64
cd build_mingw64cmake \-G "MSYS Makefiles" \-DCMAKE_INSTALL_PREFIX=$(pwd)/output_mingw64 \-DWITH_SIMD=ON \-DENABLE_SHARED=OFF \-DENABLE_STATIC=ON \-DCMAKE_BUILD_TYPE=Release \-DWITH_JPEG8=ON \-DCMAKE_ASM_NASM_COMPILER="D:/msys64/usr/bin/nasm.exe" \..make -j8
make install

导入到opencv编译

mkdir build
cd buildcmake \
-DBUILD_SHARED_LIBS=OFF \
-DWITH_OPENMP=ON \          # 启用openmp
#。。。。你的其它配置
-DWITH_JPEG=ON \            # 启用JPEG支持
-DBUILD_JPEG=OFF \          # 禁用OpenCV内置JPEG编译
-DJPEG_INCLUDE_DIR="D:/xxx/libjpeg-turbo/build_mingw64/output_mingw64/include" \   # 指定外部libjpeg-turbo的头文件路径
-DJPEG_LIBRARY="D:/xxx/libjpeg-turbo/build_mingw64/output_mingw64/lib/libjpeg.a" \ # 指定外部libjpeg-turbo的静态库路径
-DCPU_BASELINE=AVX2 \
-DBUILD_OPENJPEG=OFF \
-DWITH_OPENJPEG=OFF \
-G "MSYS Makefiles" ..make
make install

最终效果

读图片,5M jpg格式,原本140 ms,现在92 ms
写图片,1.7M jpg格式,原本149 ms,现在41 ms

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/907812.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis 主从节点

Redis 主从节点的核心区别 特性主节点 (Master)从节点 (Slave/Replica)读写权限可读可写只读(默认配置)数据流向数据来源从主节点同步数据连接关系可连接多个从节点只能连接一个主节点故障切换故障时需要手动/自动提升从节点可被提升为新的主节点命令执…

汽车安全:功能安全FuSa、预期功能安全SOTIF与网络安全Cybersecurity 解析

汽车安全的三重防线:深入解析FuSa、SOTIF与网络安全技术 现代汽车已成为装有数千个传感器的移动计算机,安全挑战比传统车辆复杂百倍。 随着汽车智能化、网联化飞速发展,汽车电子电气架构已从简单的分布式控制系统演变为复杂的移动计算平台。现…

github好玩的工具

以下是 GitHub 上一些有趣且实用的开源工具推荐,涵盖 AI 应用、效率提升、趣味开发等方向,结合最新趋势和项目热度整理: 一、AI 与深度伪造工具 Deep-Live-Cam 仅需一张图片即可在视频直播中实时替换人脸,适用于内容创作和虚拟角色开发,支持多平台硬件运行(如 NVIDIA CUD…

Python应用for循环临时变量作用域

大家好!如果你刚开始学习Python,可能会对for循环中临时变量的作用域感到好奇。下面通过一个简单的练习,帮助你理解这个概念。 代码呈现: i 0 for i in range(5):print(i)print(i)代码介绍: 首先我们初始化变量i 0然后进入for循环,这里i成为…

深度学习---负样本训练

一、负样本的本质与核心作用 1. 定义与范畴 负样本(Negative Sample)是与目标样本(正样本)在语义、特征或任务目标上存在显著差异的样本。其核心价值在于通过对比学习引导模型学习样本间的判别性特征,而非仅记忆正样本…

实验设计与分析(第6版,Montgomery)第3章单因子实验:方差分析3.11思考题3.7 R语言解题

本文是实验设计与分析&#xff08;第6版&#xff0c;Montgomery著&#xff0c;傅珏生译) 第3章单因子实验&#xff1a;方差分析3.11思考题3.7 R语言解题。主要涉及单因子方差分析&#xff0c;正态性假设检验&#xff0c;残差与拟合值的关系图&#xff0c;平方根变换。 X<-c(…

【PhysUnits】15.8 引入P1后的减法运算(sub.rs)

一、源码 这段代码实现了一个类型级别的二进制数减法系统&#xff0c;包含标准减法和带借位减法。 use core::ops::{Neg, Not, Sub}; use super::basic::{Z0, N1, P1, B0, B1, Integer, NonZero}; use super::add1::Add1; use super::sub1::Sub1; use super::standardization…

npm install命令都做了哪些事情

npm install&#xff08;或其简写 npm i&#xff09;是 Node.js 项目中最重要的命令之一&#xff0c;它负责安装项目所需的所有依赖项。下面我将详细解释这个命令的完整执行过程和底层机制&#xff0c;让你彻底理解它背后的工作原理。 一、npm install 的完整工作流程 1. 依赖…

mkdir: cannot create directory ‘gitlab-stu’: No space left on device

Linux中创建目录时报错“mkdir: cannot create directory ‘gitlab-stu’: No space left on device”&#xff0c;磁盘空间不足。 使用df命令查看&#xff0c;发现 / 下面use%占满了&#xff1a; 查看inode使用情况&#xff1a; 可以看到docker的数据大部分存放在/var/lib/do…

中国高分辨率高质量地面NO2数据集(2008-2023)

时间分辨率&#xff1a;日空间分辨率&#xff1a;1km - 10km共享方式&#xff1a;开放获取数据大小&#xff1a;15.36 GB数据时间范围&#xff1a;2008-01-01 — 2023-12-31元数据更新时间&#xff1a;2024-08-19 数据集摘要 ChinaHighNO2数据集是中国高分辨率高质量近地表空气…

Redis实战-基于redis和lua脚本实现分布式锁以及Redission源码解析【万字长文】

前言&#xff1a; 在上篇博客中&#xff0c;我们探讨了单机模式下如何通过悲观锁&#xff08;synchronized&#xff09;实现"一人一单"功能。然而&#xff0c;在分布式系统或集群环境下&#xff0c;单纯依赖JVM级别的锁机制会出现线程并发安全问题&#xff0c;因为这…

剪枝中的 `break` 与 `return` 区别详解

在回溯算法的剪枝操作中&#xff1a; if (sum candidates[i] > target) break;这个 break 既不等效于 return&#xff0c;也不会终止整个回溯过程。它只会终止当前层循环的后续迭代&#xff0c;而不会影响其他分支的回溯。让我用图解和示例详细说明&#xff1a; &#x1…

计算机网络第1章(下):网络性能指标与分层模型全面解析

目录 一、计算机网络的性能指标1.1 性能指标1&#xff1a;速率1.2 性能指标2&#xff1a;带宽1.3 性能指标3&#xff1a;吞吐量1.4 性能指标4&#xff1a;时延1.5 性能指标5&#xff1a;时延带宽积1.6 性能指标6&#xff1a;往返时延1.7 性能指标7&#xff1a;信道利用率 二、计…

C#数字图像处理(二)

文章目录 1.灰度直方图1.1 灰度直方图定义1.2 灰度直方图编程实例 2.线性点运算2.1线性点运算定义2.2 线性点运算编程实例 3.全等级直方图灰度拉伸3.1 灰度拉伸定义3.2 灰度拉伸编程实例 4.直方图均衡化4.1 直方图均衡化定义4.2 直方图均衡化编程实例 5.直方图匹配5.1 直方图匹…

训练中常见的运动强度分类

概述 有氧运动是耐力基础&#xff0c;乳酸阈值是耐力突破的关键&#xff0c;提升乳酸阈值可以延缓疲劳&#xff0c;无氧运动侧重速度和力量&#xff0c;混氧和最大摄氧量用于细化训练强度和评估潜力。 分类强度供能系统乳酸浓度训练目标有氧运动低&#xff08;60%-80% HR&…

数智管理学(十五)

第五章 数智化时代的组织结构模型 第一节 传统金字塔型结构向分布式网络型的演变 在当今数智化时代&#xff0c;企业所处的市场环境发生了翻天覆地的变化&#xff0c;技术创新日新月异&#xff0c;客户需求日益多样化和个性化&#xff0c;市场竞争愈发激烈。传统的金字塔型组…

AAA基础配置

文章目录 组网需求组网拓扑实验步骤测试结果配置文件 组网需求 为组网安全&#xff0c;经常会使用AAA技术&#xff0c;本次以CE12800交换机Window为例&#xff0c;实现AAA本地认证登录 组网拓扑 实验步骤 配置接口IP&#xff0c;连通终端进入AAA视图配置用户名密码配置账户权…

基于微信小程序的云校园信息服务平台设计与实现(源码+定制+开发)云端校园服务系统开发 面向师生的校园事务小程序设计与实现 融合微信生态的智慧校园管理系统开发

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…

RV1126-OPENCV Mat理解和AT函数

一.Mat概念 Mat 是整个图像存储的核心也是所有图像处理的最基础的类&#xff0c;Mat 主要存储图像的矩阵类型&#xff0c;包括向量、矩阵、灰度或者彩色图像等等。Mat由两部分组成&#xff1a;矩阵头&#xff0c;矩阵数据。矩阵头是存储图像的长度、宽度、色彩信息等头部信息&a…

23、Swift框架微调实战(3)-Qwen2.5-VL-7B LORA微调OCR数据集

一、模型介绍 Qwen2.5-VL 是阿里通义千问团队开源的视觉语言模型,具有3B、7B和72B三种不同规模,能够识别常见物体、分析图像中的文本、图表等元素,并具备作为视觉Agent的能力。 Qwen2.5-VL 具备作为视觉Agent的能力,可以推理并动态使用工具,初步操作电脑和手机。在视频处…