[AI绘画]sd学习记录(二)文生图参数进阶

目录

  • 7.高分辨率修复:以小博大
  • 8.细化器(Refiner):两模型接力
  • 9.随机数种子(Seed):复现图片吧

本文接续https://blog.csdn.net/qq_23220445/article/details/148460878?spm=1001.2014.3001.5501,继续讲解文生图的参数。

7.高分辨率修复:以小博大

高分辨率修复位于ui的这个地方:

点击右侧的小三角,就能打开完整的UI:

直接生成高分辨率图(比如 2048×2048 )时,模型容易因 “超出训练习惯”(多数模型训练于 512×512 ),出现多头多手、细节崩坏 。

高分辨率修复(Hires.fix )的做法是,先以 低分辨率(如 512×512 )生成基础图(稳定且不易崩 ),再用 放大算法 + 重绘 ,把低分辨率图 “无损放大” 到高分辨率(如 2048×2048 ),同时补充细节、修复崩坏。

参数如下:

  • 放大算法

就是把图片放大时所用的算法,一般采用如下几个:

Latent(默认):最常用!基于 Stable Diffusion latent 空间优化,平衡速度和细节,放大后画面自然,适合二次元、插画。特点:速度快、兼容性好,放大 2 倍无压力,细节比传统算法(如 bicubic )强。Latent (antialiased):Latent 的抗锯齿版,放大后边缘更平滑(如人物发丝、物体轮廓 ),适合解决 “放大后边缘锯齿” 问题。

Latent (bicubic):结合双三次插值(bicubic )的 Latent 算法,细节更细腻(但速度稍慢 ),适合写实风格。

4x-AnimeSharp:专为二次元 / 动漫优化的算法,放大后线条更锐利、色彩更鲜亮,适合生成高清动漫壁纸。对二次元风格 “针对性增强”,但写实图可能效果奇怪。

SwinIR_4x:基于深度学习的超分辨率算法,细节还原天花板,放大后画面接近 “重新绘制”,适合写实肖像、高精度场景。

  • 放大倍数
    决定最终分辨率是基础图的几倍(2 倍即 512→1024 )。

  • 重绘幅度
    控制 “放大后重绘的力度”。值越高,新细节越多(但可能偏离原图 );值越低,越接近原图(但细节少 )。日常选 0.3 - 0.7 。

  • 高分迭代步数
    放大后重绘的迭代次数,步数越高细节越细(但时间翻倍 )。一般设 10 - 30 ,设 0 则 “只放大不重绘”(细节少但速度快 )。

什么时候用 Hires.fix?

  1. 想做高清壁纸 / 商用图:低分辨率图细节不够,用它放大到 2K/4K 。
  2. 直接生成分辨率易崩:比如生成 1024×1024 图时人物手部崩坏,先用 512×512 生成,再用 Hires.fix 放大修复。
  3. 追求极致细节:比如发丝、衣物纹理,通过放大 + 重绘补充细节。

我们以放大倍数:2,高分迭代步数:10,重绘幅度:0.7,算法为Latent举例,在右上角就能看到此功能的作用:将画面大小从353x500提升到706x1000

最终耗时23.4s

直接绘制一张706x1000的图片,耗时31.8s

来个极端一点的,用250x250放大4倍生成1000x1000分辨率的图片,看起来还蛮精细的。

直接生成一张250x250的图,明显模糊很多。

8.细化器(Refiner):两模型接力

位于ui的这个地方

细化器就是两模型接力生成图片。右边是两个模型的切换时机,填0.8后,当生成百分之80时便会切换到细化器里面选择的模型。

比如说,我现在有两个模型:夜羊社v1.2和立绘专用模型,我想生成夜羊社风格的立绘

于是,我可以先用立绘专用模型生成一个框架,再填充夜羊社v1.2的内容,下面是不同切换时机的参考:

切换时机为0.1:

切换时机为0.5:

切换时机为0.8:

9.随机数种子(Seed):复现图片吧

位于ui的这个地方:

点开右边的小三角可以看到完整ui。

生成图像时,模型会先创建一个随机噪声图,再通过去噪得到最终画面。Seed 就是这张 “噪声图的密码”,只要种子相同,生成的图像完全一样!!就和mc的地图种子一样。

填写-1意思是每次生成都随机抽取种子。

比如说我设置种子为123,连续生成两张:

可以看到,两张图片是一模一样的。因此,当你觉得生成一张图很好看,只需要记住其种子,在保证其他参数一样的前提下就能复现,

并且固定 Seed ,只改提示词、采样方法、CFG Scale 等,可在原图基础上 “小幅度调整”(比如让人物换发型但姿势不变 ),亦可以用来生成同一场景下的不同角色 / 风格(比如 Seed=1234,分别生成 “白天”“黑夜” 的校园场景 )

比如我只把秋天这个此时此换成春天,可以看到变化比较小。

变异随机种子是基于原始 Seed,小幅度打乱噪声分布,让画面在可控范围内改变,而变异强度便是控制 改变的幅度,值越高,画面变化越大(但越可能偏离原图 )。从宽度 / 高度中调整种子是通过 “拉伸宽度 / 高度的噪声分布”,间接调整画面的横向 / 纵向细节(比如让人物左边头发变多,或让天空更广阔 )。

当你用固定 Seed 生成了一张满意的图,但想保留构图 / 风格,又想让细节随机变化(比如换人物表情、调整光影 ),就需要这些参数。

以上图为例,添加一个随机变异系数,变异强度为0.1,结果如下:可以看到主要改变的是背景。

当变异强度为0.5,结果如下:可以看到画面已经有了明显变化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/908634.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++学习思路

C++知识体系详细大纲 一、基础语法 (一)数据类型 基本数据类型 整数类型(int, short, long, long long)浮点类型(float, double, long double)字符类型(char, wchar_t, char16_t, char32_t)布尔类型(bool)复合数据类型 数组结构体(struct)联合体(union)枚举类型…

34、协程

在Linux系统中,协程是一种轻量级的线程,它们允许在多个任务之间切换,而不需要操作系统的线程调度。协程可以分为有栈协程和无栈协程,以及对称协程和非对称协程。 有栈协程 有栈协程每个协程都有自己的栈空间,允许协程…

DeepSeek 赋能金融科技,重塑开放银行生态新图景

目录 一、金融科技开放银行生态建设的现状与挑战二、DeepSeek 技术解析2.1 DeepSeek 的技术原理与特点2.2 与其他相关技术的对比优势 三、DeepSeek 在开放银行生态建设中的具体应用场景3.1 智能客服与财富管理3.2 风控与合规管理3.3 生态协同与数据共享 四、DeepSeek 应用案例分…

【QT控件】输入类控件详解

目录 一、QLineEdit 二、Text Edit 三、Combo Box 四、Spin Box 五、Date Edit & Time Edit 六、Dial 七、Slider QT专栏:QT_uyeonashi的博客-CSDN博客 一、QLineEdit QLineEdit 用来表示单行输入框. 可以输入一段文本, 但是不能换行 核心属性 核心信号…

【Oracle】存储过程

个人主页:Guiat 归属专栏:Oracle 文章目录 1. 存储过程基础概述1.1 存储过程的概念与特点1.2 存储过程的组成结构1.3 存储过程的优势 2. 基础存储过程2.1 简单存储过程2.1.1 创建第一个存储过程2.1.2 带变量的存储过程 2.2 带参数的存储过程2.2.1 输入参…

【MATLAB代码】制导方法介绍与例程——三点法|三维空间,动态目标导引(订阅专栏后可直接查看源代码)

三点法导引是一种导弹制导策略,通过计算导弹、目标和制导站之间的相对位置来确保导弹准确追踪移动目标。该方法利用三角定位和动态调整,实时更新导弹的飞行路径,以提高命中率,广泛应用于军事导弹和无人机等领域。文中有完整的matlab源代码,订阅专栏后即可查看 文章目录 代…

Servlet 快速入门

文章目录 概念SpringBoot 测试案例执行原理传统 Servlet在 SpringBoot (嵌入式 Tomcat Spring MVC) 中请求从浏览器到业务代码的完整步骤关键点流程图 参考 概念 运行在服务器端的小程序, Servlet 就是一个接口,定义 Java 类被浏…

Java 8 Stream API 入门到实践详解

一、告别 for 循环&#xff01; 传统痛点&#xff1a; Java 8 之前&#xff0c;集合操作离不开冗长的 for 循环和匿名类。例如&#xff0c;过滤列表中的偶数&#xff1a; List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…

黄柏基因组-小檗碱生物合成的趋同进化-文献精读142

Convergent evolution of berberine biosynthesis 小檗碱生物合成的趋同进化 摘要 小檗碱是一种有效的抗菌和抗糖尿病生物碱&#xff0c;主要从不同植物谱系中提取&#xff0c;特别是从小檗属&#xff08;毛茛目&#xff0c;早期分支的真双子叶植物&#xff09;和黄柏属&…

机器学习14-迁移学习

迁移学习学习笔记 一、迁移学习概述 迁移学习是机器学习中的一个重要领域&#xff0c;它旨在解决当目标任务的训练数据有限时&#xff0c;如何利用与目标任务相关但不完全相同的源任务数据来提高学习性能的问题。在现实世界中&#xff0c;获取大量高质量的标注数据往往成本高…

013旅游网站设计技术详解:打造一站式旅游服务平台

旅游网站设计技术详解&#xff1a;打造一站式旅游服务平台 在互联网与旅游业深度融合的时代&#xff0c;旅游网站成为人们规划行程、预订服务的重要工具。一个功能完备的旅游网站&#xff0c;通过用户管理、订单管理等核心模块&#xff0c;实现用户与管理员的高效交互。本文将…

量子计算+AI:特征选择与神经网络优化创新应用

在由玻色量子协办的第二届APMCM“五岳杯”量子计算挑战赛中&#xff0c;来自北京理工大学的Q-Masterminds团队摘取了银奖。该团队由北京理工大学张玉利教授指导&#xff0c;依托玻色量子550计算量子比特的相干光量子计算机&#xff0c;将量子计算技术集成到特征选择和神经网络剪…

Maven相关问题:jna版本与ES冲突 + aop失效

文章目录 1、背景2、解决3、一点思考4、环境升级导致AOP失效5、okhttp Bean找不到6、总结 记录一些Maven依赖相关的思考 1、背景 做一个监控指标收集&#xff0c;用一下jna依赖&#xff1a; <dependency><groupId>net.java.dev.jna</groupId><artifact…

gitlab CI/CD本地部署配置

背景: 代码管理平台切换为公司本地服务器的gitlab server。为了保证commit的代码至少编译ok&#xff0c;也为了以后能拓展test cases&#xff0c;现在先搭建本地gitlab server的CI/CD基本的编译job pipeline。 配置步骤&#xff1a; 先安装gitlab-runner: curl -L "ht…

移除元素-JavaScript【算法学习day.04】

题目链接&#xff1a;27. 移除元素 - 力扣&#xff08;LeetCode&#xff09; 第一种思路 标签&#xff1a;拷贝覆盖 主要思路是遍历数组 nums&#xff0c;每次取出的数字变量为 num&#xff0c;同时设置一个下标 ans 在遍历过程中如果出现数字与需要移除的值不相同时&#xff…

leetcode sql50题

在中文站没找到对应的集合&#xff0c;想来自己动手拷贝过来&#xff0c;方便大家面试复习用&#xff0c;对应英文站点&#xff1a; https://leetcode.com/studyplan/top-sql-50/ Select #1757. 可回收且低脂的产品 链接: https://leetcode.cn/problems/recyclable-and-low-fa…

Dynadot专业版邮箱工具指南(五):将域名邮箱添加至Outlook客户端

关于Dynadot Dynadot是通过ICANN认证的域名注册商&#xff0c;自2002年成立以来&#xff0c;服务于全球108个国家和地区的客户&#xff0c;为数以万计的客户提供简洁&#xff0c;优惠&#xff0c;安全的域名注册以及管理服务。 Dynadot平台操作教程索引&#xff08;包括域名邮…

【RTSP从零实践】1、根据RTSP协议实现一个RTSP服务

&#x1f601;博客主页&#x1f601;&#xff1a;&#x1f680;https://blog.csdn.net/wkd_007&#x1f680; &#x1f911;博客内容&#x1f911;&#xff1a;&#x1f36d;嵌入式开发、Linux、C语言、C、数据结构、音视频&#x1f36d; &#x1f923;本文内容&#x1f923;&a…

Python网页数据抓取常用的库及方法介绍

Python网页数据抓取常用的库及方法介绍 摘要:以下是Python网络数据抓取常用的6个库的详细介绍,包括它们的概述以及每个库中最常用的10个函数(如果某些库常用函数不足10个,则列出所有常用函数)。每个函数都附带功能描述、用法说明和使用示例。这些库在网络爬虫、数据…

6.5 note

一个很有意思的dfs模拟题_前序遍历 这个问题的话前置内容显然是字典序&#xff0c;什么是字典序呢&#xff1f; 顾名思义&#xff0c;就是词语在字典中的顺序&#xff0c;也就是我们最常说的a,abandon,ability&#xff08;我记得前三个是这个&#xff09; 这是一种字符串之间比…