Stable Diffusion入门-ControlNet 深入理解 第四课:风格迁移与重绘控制模型——让AI也有“艺术天赋”!


大家好,欢迎回到 Stable Diffusion入门-ControlNet 深入理解 系列的第四课!

如果你还没有看过上一课,赶紧补课哦:Stable Diffusion入门-ControlNet 深入理解 第三课。

上一课我们讲解了 ControlNet 结构类模型,今天我们继续带你了解 风格迁移类模型重绘控制类模型,这两种模型将帮助你在AI绘画中自由玩转“艺术创作”和“创意修图”。

准备好了吗?让我们一起来揭开这些神奇的模型的面纱!




一、风格迁移类模型——让AI学会“模仿大师”


风格迁移类模型的作用,就是让AI学习一张参考图的“风格”,然后将这种风格应用到你给定的新图像上。

这就像是你给AI看了一幅蒙娜丽莎的画,然后让它根据蒙娜丽莎的风格去画你的自拍。

是不是听起来就很酷?


1. Shuffle洗牌——风格大变样


Shuffle 算法的作用简单来说就是“打乱”。

它通过打散参考图的配色来获取信息,并将这种风格应用到新的图像上。

换句话说,AI会“模仿”你给它的参考图的配色,但它并不会完全复制,而是给你一张“新”图,保持了参考图的色调,又不失原创感。


在这里插入图片描述

需要注意的是,这个 ControlNet 只对1.5模型有效,别忘了,随着时间的推移,这个预处理器可能会被逐渐淘汰哦!


2. Instant-ID——让面部特征完美迁移


Instant-ID 是由小红书开发的面部特征迁移模型,它的厉害之处在于,它可以对面部特征进行精准的迁移,确保新的图像能够完美呈现出参考图中的人物面部特点。

比如,你可以给AI看一张你朋友的照片,然后让它画出一张完全符合你朋友面部特征的新画像。

这个模型的使用要求有点特殊:

  • 只能在 SDXL 大模型中使用。
  • 提示词引导系数(CFG Scale)需要比通常的设置值低 3-5,否则可能会出现“涂抹感”很强的问题。
  • 需要两个 ControlNet 来配合使用,每个对应不同的面部特征处理。

3. IP-Adapter——腾讯的“黑科技”适配器


IP-Adapter 是腾讯实验室发布的一个新适配器,它的主要作用是将输入的图像作为图像提示词进行风格迁移。

就像 MJ(MidJourney)的垫图一样,它能帮助AI学习参考图的风格,然后把这些风格应用到你的图像上。


在这里插入图片描述


这个适配器有多种预处理器,其中有些是专门用来换脸的——比如 face_id 系列,就能让你给AI一张照片,然后生成一个类似面部特征的图像。


在这里插入图片描述

需要注意的是:IP-Adapter 配合 Lora 使用时,必须确保 LoraControlNet 的模型一致,否则可能效果不理想。


在这里插入图片描述


4. Reference参考——让AI学会“借鉴”


Reference 预处理器的强大之处在于,它可以根据给定的参考图像的配色、色调、风格等,生成一张具有相同风格的新图像。

不同的是,生成的图像会在保持原图风格的同时,产生一定的多样性差异。

你可以使用 reference_adain 来生成二次元风格的图像,或者使用 reference_only 来进行更通用的风格迁移。

如果你需要更复杂的风格迁移效果,可以选择 Reference_adain+attn,它能够生成更高级的特征转换效果。


在这里插入图片描述

注意: reference只有预处理器,没有模型:


在这里插入图片描述




二、重绘控制类模型——让AI也能进行“创意修图”


风格迁移让AI模仿画风,而 重绘控制类模型 则是让AI进行图像的“创意重绘”,无论是修图、换背景,还是改变人物姿势,这些都能通过重绘控制类模型来实现。


1. OpenPose-姿态——让AI了解人物动作


在第一篇文章中,我们介绍过 OpenPose,它是用来控制人物姿势和形态的模型。


在这里插入图片描述

通过 OpenPose,你可以让AI精确地理解人物的动作,比如跳舞、跑步、摆姿势等。


dw_openpose_full 是当前最强的预处理器之一,它是 OpenPose_full 的增强版,能够让AI识别并生成更加精细的人物姿势。而 animal_openpose 甚至能够识别动物的姿势,真的是突破性进展!


2. Inpaint局部重绘——局部修图,效果满分


Inpaint 系列模型主要用于局部重绘,通常用于扩图或者细节修复。


在这里插入图片描述


如果你有一张图像想要扩展,或者其中某些部分需要进行修改,inpaint_only 可以帮助你在保留原图内容的基础上,生成新内容。

inpaint_only+lama 则可以彻底抹除原有内容后重新生成,非常干净。

inpaint_global_harmonious 全局融合算法,因此会导致涂抹以外的区域也发生一些变化,并且整体画面的颜色也会发生改变。


3. InstructP2P——指令式修图


想让一张图片变成另一种完全不同的风格?比如说,“让它变成火焰”?InstructP2P 就能实现这个梦想!通过这个模型,你可以给AI一个简单的指令:“Make Y into X”,它会根据你的指令对图像进行创意修改。


4. Recolor重上色——AI的“涂色书”功能


如果你已经有了一张图,但想给它重新上色,Recolor 系列模型就派上用场了。


在这里插入图片描述


它可以调节图像的亮度和强度,为图像增加新的色彩效果。只要你告诉AI,你想要的色调是什么,它就能帮你把图像重新上色,焕发新生。


5. Tile——给图片加点“小细节”


Tile 模型的作用就是在保持图片布局的基础上,给图片添加细节。

它经常用来进行高清修复、画质提升,甚至可以用来转换图片风格,像是将真人照片转为漫画风格,或者做艺术字的设计。


在这里插入图片描述


  • tile_resample(分块-重采样):仅保持图片布局,颜色会进行一些变化。(常用)

  • tile_colorfix+sharp(分块-固定颜色+锐化):保持图片布局的同时固定图片的颜色,并做一些锐化

  • tile_colorfix(分块-固定颜色):保持图片布局的同时固定图片的颜色

  • blur_gaussian(模糊-高斯模糊):主要用于调整景深用的

tile 突出用途之一是和tile_diffusion及tile_vae三者组合进行图生图放大,可以显著提高运行效率及放大效果。



总结


今天,我们探讨了 风格迁移类模型重绘控制类模型,它们将让你的创作更加自由、多样。

从风格迁移到局部修图,从姿态控制到图像重上色,ControlNet 为AI绘画提供了无尽的创意空间。


下一课,我们将深入探讨 ControlNet 的其他高级应用,敬请期待!有任何问题或者想法,欢迎在评论区和我互动,我们下课见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/86737.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/86737.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国产鸿蒙系统开放应用侧载,能威胁到Windows地位吗?

上个月华为正式发布了 HarmonyOS PC 操作系统,关于生态方面大家其实一直蛮担心。 例如不兼容Windows应用、不支持应用侧载等。 不过,在最近举行的华为开发者大会 2025 电脑分论坛上,华为终端 BG 平板与 PC 产品线总裁(朱懂东&am…

Linux登录检查脚本

登录检查脚本 提高兼容性(适应不同Linux发行版)增强可视化效果和可读性增加关键资源警戒提示优化表格对齐和颜色使用添加系统安全状态检查 #!/bin/bash# 改进版系统登录提示脚本 # 优化点:兼容性增强、资源警戒提示、表格美化、安全状态检查…

jenkinsfile调用groovy

先决条件 gitlab存放jenkinsfile以及groovy代码,jenkins我个人使用的是2.486具体的部署方法自己搞定,一堆文档. gitlab创建一个devops8项目组以及my-jenkins-demo2项目用于演示过程 创建群组 这里已经创建好相关群组. 进入群组创建新项目 创建一个空白项目 配置项目选项 说明…

Ubuntu20.04离线安装Realtek b852无线网卡驱动

最近有个项目,需要在 Ubuntu20.04 LTS 下开发,首先是安装 Linux,我们可以从下面的网址下载: https://releases.ubuntu.com/20.04/ 本以为一切顺利,结果刚开始就给我整不会了。我的电脑是联想设计师GeekPro7&#xff…

1 Studying《Computer Architecture A Quantitative Approach》5-7

目录 5 Thread-Level Parallelism 5.1 Introduction 5.2 Centralized Shared-Memory Architectures 5.3 Performance of Symmetric Shared-Memory Multiprocessors 5.4 Distributed Shared-Memory and Directory-Based Coherence 5.5 Synchronization: The Basics 5.6 M…

融智兴科技: RFID超高频柔性抗金属标签解析

在当今科技飞速发展的时代, RFID技术凭借其独特的优势,在众多领域得到了广泛应用。然而,在金属环境中,传统RFID标签往往面临着诸多挑战,如信号干扰、识别距离短等问题。融智兴科技推出的RFID 超高频柔性抗金属标签&…

PHP Error: 深入解析与解决策略

PHP Error: 深入解析与解决策略 引言 PHP作为世界上最流行的服务器端脚本语言之一,在全球范围内被广泛使用。然而,在PHP的开发过程中,错误处理是一个非常重要的环节。本文将深入探讨PHP错误处理的相关知识,包括错误类型、错误配置、错误日志以及常见的错误解决策略。 PH…

零基础langchain实战二:大模型输出格式化成json

零基础langchain实战一:模型、提示词和解析器-CSDN博客 书接上文 大模型输出格式化 在下面例子中:我们需要将大模型的输出格式化成json。 import os from dotenv import load_dotenvload_dotenv() # 加载 .env 文件 api_key os.getenv("DEEPS…

高通手机跑AI系列之——人脸变化算法

环境准备 手机 测试手机型号:Redmi K60 Pro 处理器:第二代骁龙8移动--8gen2 运行内存:8.0GB ,LPDDR5X-8400,67.0 GB/s 摄像头:前置16MP后置50MP8MP2MP AI算力:NPU 48Tops INT8 &&…

TortoiseSVN 安装教程

前言 TortoiseSVN 是一款流行的 免费开源 的 Subversion (SVN) 客户端,专门为 Windows 操作系统 设计。它通过 Windows 资源管理器集成 提供直观的图形化界面,使用户可以轻松管理版本控制的文件和目录,无需使用命令行。 主要特点 资源管理器…

多张图片生成PDF每张图片生成pdf的一页

需要的库 <!-- 生成pdf--><dependency><groupId>com.itextpdf</groupId><artifactId>itextpdf</artifactId><version>5.5.10</version></dependency><!-- https://mvnrepository.com/artifact/commons-net/commons-n…

Java基础 Map集合框架 LinkedHashMap

LinkedHashMap LinkedHashMap类架构与继承关系核心特性继承自 HashMap有序性插入顺序访问顺序 双向链表结构非线程安全1.并发修改导致数据丢失2.并发迭代导致 ConcurrentModificationException3.并发修改导致链表结构破坏解决方案1. 使用 Collections.synchronizedMap&#xff…

MySQL 离线安装MariaDB

描述 离线环境下安装MySQL数据库&#xff0c;也就是MariaDB 操作 1、找到自带的mysql rpm -qa | grep -i ^mysql-rpm -qa | grep -i ^maria-2、卸载对应的包 rpm --nodeps -ev mysql-libs-5.1.73-8.el6_8.x86_64安装 MariaDb 离线安装包官网下载&#xff1a;地址 这个文…

JSON简介及其应用

JSON简介及其应用 A Brief Introduction and Applications of JSON By JacksonML 1. JSON的概念 JSON&#xff08;JavaScript Object Notation&#xff09; 是一种轻量级的数据交换格式&#xff0c;采用键值对&#xff08;key-value&#xff09;的方式组织数据&#xff0c;…

RNN(循环神经网络)与LSTM(长短期记忆网络)输出的详细对比分析

今天在与同事探讨RNN时&#xff0c;引出了一个主题&#xff0c;RNN和LSTM的输出有什么区别。 以下是关于传统RNN&#xff08;循环神经网络&#xff09;与LSTM&#xff08;长短期记忆网络&#xff09;隐藏层内容、输出结果及模型区别的详细对比分析&#xff0c;结合结构原理、数…

【闲谈】技术债:软件开发的隐形杀手

编程中的“技术债”&#xff1a;隐形杀手与化解之道 在软件开发的世界里&#xff0c;我们常谈性能、安全、架构设计、用户体验等话题&#xff0c;但有一个常被忽视的概念却如影随形、悄然吞噬着项目的健康——技术债&#xff08;Technical Debt&#xff09;。 本文将带你深入…

Elasticsearch | 索引和模板字段管理:增加新字段的详细操作

关注CodingTechWork 背景介绍 Elasticsearch 是一款基于 Lucene 的搜索和数据分析引擎&#xff0c;广泛应用于日志分析、全文检索等领域。在使用 Elasticsearch 时&#xff0c;字段是存储在索引中的数据单位&#xff0c;字段的定义决定了数据的存储方式及其检索效率。因此&…

HTML表格中<tfoot>标签用法详解

在HTML中&#xff0c;<tfoot>标签用于定义表格的页脚&#xff08;表脚&#xff09;&#xff0c;通常包含汇总信息&#xff08;如总计、平均值等&#xff09;。其核心特点和使用方法如下&#xff1a; 基本特性 位置灵活 <tfoot>必须位于<table>内&#xff0c…

深度学习正负样本比例的影响及其调节方法

在深度学习中&#xff0c;数据是模型性能的决定性因素之一。特别是在二分类问题中&#xff0c;正负样本的比例对模型训练的影响尤为显著。本文将探讨正负样本比例对深度学习的影响&#xff0c;并给出相应的调节方法和代码示例。 什么是正负样本比例&#xff1f; 在二分类问题…

【公司经营】安全公司产品经营

一、产品经营 1.1 产品矩阵设计方法&#xff1a;风险场景驱动​ ​分层产品架构​ ​基础层​&#xff1a;防火墙/WAF/EDR&#xff08;标准化硬件软件&#xff09;​分析层​&#xff1a;SOC平台/XDR&#xff08;年订阅制&#xff0c;SaaS化交付&#xff09;​响应层​&#…