影楼精修-AI衣服祛褶皱算法解析

注:为避免侵权,本文所用图像均为AIGC生成或无版权网站提供;

衣服祛褶皱功能,目前在像素蛋糕、美图云修、百度网盘AI修图、阿里云都有相关的功能支持,它的价值就是将不平整的衣服图像,变得整齐平整,去掉不美观的衣服褶皱等。

功能分析

我们以像素蛋糕为例,来分析衣服祛褶皱功能,像素蛋糕中该功能界面如下:

支持衣服细褶皱和粗褶皱分别祛除两个参数调节+整体程度参数调节;

效果举例如下:

 

算法方案

对于衣服祛褶皱功能,目前公开的算法资料:

Paper: ABPN: Adaptive Blend Pyramid Network for Real-Time Local Retouching of Ultra High-Resolution Photo

Code:https://www.modelscope.cn/models/iic/cv_unet_skin-retouching/

但这份开源代码是做人像美肤的代码,是论文算法的一个应用,并未提供衣服祛褶皱相关的模型;

算法流程图如下:

  • 自适应混合金字塔网络(ABPN),主要由上下文感知局部修饰层(LRL)和自适应混合金字塔层(BPL)组成。

  • LRL采用多任务架构,包括共享编码器、掩码预测分支(MPB)和局部修饰分支(LRB)。MPB通过跳连接和软掩码引导特征融合,LRB利用门控卷积(GConv)和局部注意力模块(LAM)实现高细节保真度的局部修饰。

  • BPL基于混合层概念,设计了自适应混合模块(ABM)及其反向版本(R-ABM),通过逐步上采样和细化混合层,将低分辨率结果扩展到原始尺寸。ABM通过可学习的参数和Hadamard积实现灵活的图像转换,R-ABM则用于生成混合层。

在论文中,作者也对比了在PS中使用中性灰+Softlight的效果,如下图所示:

在对比中,Softlight的效果较差,论文方法确实获得了不错的效果。

该论文方案可能也为当前市面上主流的几家提供了一些技术方案。

但是,个人看来,这个算法还是有一些提升空间的,比如:

1.网络输入图像可以处理5000×5000左右的大图,如果是更大分辨率的图,如何保证最终原图清晰度的信息问题,存在一定的疑问。尤其是影楼修图领域,5000×5000算是小图了。

2.资源消耗,网络输入分辨率越大,对应资源消耗越大:

针对上述问题,个人优化方案:

方案一

1.使用上述方案,但处理最小分辨率512×512,保证较小的资源消耗和较快的性能;假设原图S,resize小图为S_small上述方案的效果图为D;

2.根据D和S_small进行中性灰图层计算,注意,这里需要参考线性光图层混合,不可使用柔光图层混合,论文中对比Softlight效果,个人觉得是有问题的,可能做算法的小伙伴并不擅长PS修图。最终得到中性灰图层蒙版D_mask;

3.将D_mask还原回原图大小,得到图D_hd;

4.将D_hd与原图S做中性灰图层混合,得到最终衣服祛褶皱效果D;

举例如下:

方案二

1.构建衣服祛褶皱中性灰蒙版网络,输入512×512小图+对应的衣服区域mask,输出中性灰蒙版D_mask;

2.将D_mask还原回原图大小,得到图D_hd;

3.将D_hd与原图S做中性灰图层混合,得到最终衣服祛褶皱效果D;

这个方案最大的优势是可以将原图与效果图完全解耦,对于大分辨率的图,中性灰图层混合并不会影响原图本身其他区域的清晰度,同时,网络推理性能也可以得到兼顾;

上述方案仅是本人的一些个人见解,用来抛砖引玉,欢迎与大家沟通交流;

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/pingmian/83815.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Celery 核心概念详解及示例

Celery 核心概念详解及示例 Celery 是一个简单、灵活且可靠的分布式系统,用于处理大量消息,提供对任务队列的操作,并支持任务的调度和异步执行。它常用于深度优化 Web 应用的性能和响应速度,通过将耗时的操作移到后台异步执行&am…

智能对联网页小程序的仓颉之旅

#传统楹联遇上AI智能体:我的Cangjie Magic开发纪实 引言:一场跨越千年的数字对话 "云对雨,雪对风,晚照对晴空"。昨天晚上星空璀璨,当我用仓颉语言写下第一个智能对联网页小程序的Agent DSL代码时&#xff0…

《ERP原理与应用教程》第3版习题和答案

ERP原理与应用教程是一门系统介绍企业资源计划(Enterprise Resource Planning, ERP)系统核心理论、技术架构及实施应用的综合性课程。它主要面向管理类、信息类、工程类等专业学生及企业管理者,旨在培养对现代企业信息化管理的理解与实践能力。以下是该课程的详细解析: 一…

SOC-ESP32S3部分:32-LVGL显示框架

飞书文档https://x509p6c8to.feishu.cn/wiki/Ly6ywvphqi6HZlk38vHcz2OgnXg LVGL是一个开源的显示框架,使用它可以加速我们开发带显示屏交互的应用。 IDF对于LVGL的支持一直有更新的,我们可以很方便在组件库中搜索到对应版本的LVGL,并把它添…

原理图与 PCB 设计流程及注意事项

原理图与 PCB 设计流程及注意事项 一、原理图设计 1. 首先,需要创建一个新的项目,在此项目中建立原理图。 2. 接着,在原理图中添加元件和芯片。可以从元件库中挑选所需的元件,如电阻、电容等。既可以在元件库中进行搜索查找&…

LeetCode--23.合并k个升序链表

解题思路: 1.获取信息: 给出了多个升序链表,要求合并成一个升序链表,返回首元结点 2.分析题目: 外面在21题的时候,讲了怎样合并两个升序链表为一个升序链表,不了解的,建议去看一下21…

【国产化适配】如何选择高效合规的安全数据交换系统?

一、安全数据交换系统的核心价值与国产化需求 在数字化转型浪潮中,企业数据流动的频率与规模呈指数级增长,跨网文件传输已成为日常运营的刚需,所以安全数据交换系统也是企业必备的工具。然而,数据泄露事件频发、行业合规要求趋严…

JMM初学

文章目录 1,线程间的同步和通信1.1, 共享内存并发模型 (Shared Memory Model)线程通信机制线程同步机制特点 1.2, 消息传递并发模型 (Message Passing Model)线程通信机制线程同步机制特点 适用场景对比 2,Java内存模型JMM2.0,Java内存模型的基础(1)内存…

【动手学MCP从0到1】2.5 MCP中的Context日志输出、进度汇报和服务端调用客户端的大模型项目实现步骤详解

MCP中的Context 1. Context2. 日志输出2.1 服务端2.2 客户端2.2.1 客户端代码调试2.2.2 客户端全部代码 3. 进度汇报3.1 服务端3.2 客户端3.2.1 客户端代码调试3.2.2 客户端全部代码 4. 模型调用4.1 服务端4.2 客户端4.2.1 客户端代码调试4.2.2 客户端全部代码 1. Context Con…

QT自定义资源管理器

使用qt 和 C实现。还在优化中 项目地址:GitHub - Linda1226/FileResourceManager: 自定义资源管理器 有问题可以交流

[华为eNSP] OSPF综合实验

目录 配置流程 画出拓扑图、标注重要接口IP 配置客户端IP 配置服务端IP 配置服务器服务 配置路由器基本信息:名称和接口IP 配置路由器ospf协议 测试结果 通过配置OSPF路由协议,实现跨多路由器的网络互通,并验证终端设备的访问能力。 …

如何把本地服务器变成公网服务器?内网ip网址转换到外网连接访问

​ 内网IP只能在本地内部网络连接访问,当本地搭建服务器部署好相关网站或应用后,在局域网内可以通过内网IP访问,但在外网是无法直接访问异地内网IP端口应用的,只有公网IP和域名才能实现互联网上的访问。那么需要如何把本地服务器变…

Linux-文件管理及归档压缩

1.根下的目录作用说明: /:Linux系统中所有的文件都在根下/bin:(二进制命令目录)存放常用的用户命令/boot:系统启动时的引导文件(内核的引导配置文件,grub配置文件,内核配置文件) 例…

从零开始的python学习(七)P95+P96+P97+P98+P99+P100+P101

本文章记录观看B站python教程学习笔记和实践感悟,视频链接:【花了2万多买的Python教程全套,现在分享给大家,入门到精通(Python全栈开发教程)】 https://www.bilibili.com/video/BV1wD4y1o7AS/?p6&share_sourcecopy_web&v…

Linux 查找特定字符详细讲解

CentOS 7 中使用 grep 查找特定字符详细笔记​ 一、grep 命令概述​ grep 全称为 Global Regular Expression Print,即全局正则表达式打印,是 CentOS 7 系统中用于文本搜索的核心工具。它基于正则表达式或固定字符串,在文件、标准输入流中进…

uniappx插件nutpi-idcard 开发与使用指南(适配鸿蒙)

uniappx插件nutpi-idcard 开发与使用指南(适配鸿蒙) 前言 nutpi-idcard 是一个基于 UTS (uni-app TypeScript Syntax) 开发的 uni-app 插件适配鸿蒙,主要用于解析身份证号码,提取其中的关键信息,如地区、出生日期、性…

Grafana-ECharts应用讲解(玫瑰图示例)

工具: MySQL 数据库 MySQL Workbench 数据库管理工具(方便编辑数据) Grafana v11.5.2 Business Charts 6.6(原 Echarts插件) 安装 安装 MySQL社区版安装 MySQL Workbench安装 Grafana在 Grafana 插件中搜索 Business Charts 进行安装以上安装步骤网上教程很多,自行搜…

React状态管理Context API + useReducer

在 React 中,Context API useReducer 是一种轻量级的状态管理方案,适合中小型应用或需要跨组件共享复杂状态的场景。它避免了 Redux 的繁琐配置,同时提供了清晰的状态更新逻辑。 1. 基本使用步骤 (1) 定义 Reducer 类似于 Redux 的 reduce…

3 个优质的终端 GitHub 开源工具

1、Oh My Zsh Oh My Zsh 是一个帮助你管理和美化 zsh 终端的开源工具。它让你的终端更炫酷、更高效。安装后,你可以快速使用各种插件和主题,比如常见的 git 命令简化、支持多种编程语言工具等,每次打开终端都会有惊喜。无论你是开发者还是普…

无人机巡检智能边缘计算终端技术方案‌‌——基于EFISH-SCB-RK3588工控机/SAIL-RK3588核心板的国产化替代方案‌

一、方案核心价值‌ ‌实时AI处理‌:6TOPS NPU实现无人机影像的实时缺陷检测(延迟<50ms)‌全国产化‌:芯片、操作系统、算法工具链100%自主可控‌极端环境适配‌:-40℃~85℃稳定运行,IP65防护等…