开始 ComfyUI 的 AI 绘图之旅-Qwen-Image-Edit(十二)

文章标题

  • 一、Qwen-Image-Edit
    • 1.ComfyOrg Qwen-Image-Edit 直播回放
    • 2.Qwen-Image-Edit ComfyUI 原生工作流示例
      • 2.1 工作流文件
      • 2.2 模型下载
      • 3.3 按步骤完成工作流

一、Qwen-Image-Edit

Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本,基于20B模型进一步训练,支持精准文字编辑和语义/外观双重编辑能力。

Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本。它基于20B的Qwen-Image模型进一步训练,成功将Qwen-Image的文本渲染特色能力拓展到编辑任务上,以支持精准的文字编辑。此外,Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL(获取视觉语义控制)和VAE Encoder(获得视觉外观控制),以同时获得语义/外观双重编辑能力。

模型特性

特性包括:

  • 精准文字编辑: Qwen-Image-Edit支持中英双语文字编辑,可以在保留文字大小/字体/风格的前提下,直接编辑图片中文字,进行增删改。
  • 语义/外观 双重编辑: Qwen-Image-Edit不仅支持low-level的视觉外观编辑(例如风格迁移,增删改等),也支持high-level的视觉语义编辑(例如IP制作,物体旋转等)
  • 强大的跨基准性能表现: 在多个公开基准测试中的评估表明,Qwen-Image-Edit 在编辑任务中均获得SOTA,是一个强大的图像生成基础模型。

官方链接:

  • GitHub 仓库
  • Hugging Face
  • ModelScope

1.ComfyOrg Qwen-Image-Edit 直播回放

2.Qwen-Image-Edit ComfyUI 原生工作流示例

请确保你的 ComfyUI 已经更新。
  • ComfyUI 下载
  • ComfyUI 更新教程

本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。

如果加载工作流时有节点缺失,可能原因有:

  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

2.1 工作流文件

更新 ComfyUI 后你可以从模板中找到工作流文件,或者将下面的工作流拖入 ComfyUI 中加载
Qwen-image 文生图工作流

下载下面的图片作为输入
https://raw.githubusercontent.com/Comfy-Org/example_workflows/refs/heads/main/image/qwen/qwen-image-edit/input.png
Qwen-image 文生图工作流

2.2 模型下载

所有模型都可在 Comfy-Org/Qwen-Image_ComfyUI 或 Comfy-Org/Qwen-Image-Edit_ComfyUI 找到

Diffusion model

  • qwen_image_edit_fp8_e4m3fn.safetensors

LoRA

  • Qwen-Image-Lightning-4steps-V1.0.safetensors

Text encoder

  • qwen_2.5_vl_7b_fp8_scaled.safetensors

VAE

  • qwen_image_vae.safetensors

安装aria2快速下载模型,几乎能将我家1000M的宽带跑满,每秒80~90M,接下来的介绍模型都会给出安装命令。

apt install aria2
aria2c https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/resolve/main/split_files/diffusion_models/qwen_image_edit_fp8_e4m3fn.safetensors -o ComfyUI/models/diffusion_models/qwen_image_edit_fp8_e4m3fn.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/lightx2v/Qwen-Image-Lightning/resolve/main/Qwen-Image-Lightning-4steps-V1.0.safetensors -o ComfyUI/models/loras/Qwen-Image-Lightning-4steps-V1.0.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/resolve/main/split_files/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors -o ComfyUI/models/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/resolve/main/split_files/vae/qwen_image_vae.safetensors -o ComfyUI/models/vae/qwen_image_vae.safetensors --auto-file-renaming=false --allow-overwrite=false

小技巧:你要是打不开https://huggingface.co,可以将其换成为https://hf-mirror.com/试一试
Model Storage Location

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen_image_edit_fp8_e4m3fn.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

3.3 按步骤完成工作流

在这里插入图片描述

  1. 模型加载
    • 确保 Load Diffusion Model节点加载了qwen_image_edit_fp8_e4m3fn.safetensors
    • 确保 Load CLIP节点中加载了qwen_2.5_vl_7b_fp8_scaled.safetensors
    • 确保 Load VAE节点中加载了qwen_image_vae.safetensors
  2. 图片加载
    • 确保 Load Image节点中上传了用于编辑的图片
  3. 提示词设置
    • CLIP Text Encoder节点中设置好提示词
  4. Scale Image to Total Pixels 节点会将你输入图片缩放到总像素为 一百万像素,
    • 主要是避免输入图片尺寸过大如 2048x2048 导致的输出图像质量损失问题
    • 如果你很了解你输入的图片尺寸,你可以使用 Ctrl+B 绕过这个节点
  5. 如果你要使用 4 步 Lighting LoRA 来实现图片生成的提速,你可以选中 LoraLoaderModelOnly 节点,然后按 Ctrl+B 启用该节点
  6. 对于 Ksampler 节点的 stepscfg 设置,我们在节点下方增加了一个笔记,你可以测试一下最佳的参数设置
  7. 点击 Queue 按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车) 来运行工作流

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/99076.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/99076.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机械制造专属ERP:降本增效与数字转型的关键

转型升级压力下,ERP系统是机械企业破局的得力助手。本文深入解析ERP的核心功能、选型要点与实施价值,助您精准选型,赋能智能制造,全面提升竞争力。在数字化浪潮席卷之下,机械制造企业正面临提质、增效、降本的关键转型…

npm / yarn / pnpm 包管理器对比与最佳实践(含国内镜像源配置与缓存优化)

这篇不是“谁更快”的玄学讨论,而是把团队能落地的做法一次说清:如何选型、如何统一版本、如何把镜像与缓存配好、如何在 CI 和 Monorepo 下稳住“可重复构建”。 一、结论先说在前 单仓库 / 以稳定为先:直接用 npm(配合 npm ci) 足够,维护成本低,生态一等一,Node 16.1…

Python项目全面打包指南:从EXE到绿色软件包

📦 Python项目全面打包指南:从EXE到绿色软件包 文章目录 📦 Python项目全面打包指南:从EXE到绿色软件包 1 打包基础概念与工具选型 1.1 核心打包概念 1.2 工具对比与选型 2 项目环境准备与依赖管理 2.1 创建和管理虚拟环境 2.2 依赖管理最佳实践 2.3 依赖导出与规范文件处…

JAVA:Spring Boot 集成 FFmpeg 实现多媒体处理

1、简述 在现代 Web 应用中,音视频处理需求越来越常见,例如:视频转码、截图、音频提取、格式转换等。FFmpeg 是一个功能极其强大的开源音视频处理工具,可以帮助我们高效完成这些任务。本文将介绍如何在 Spring Boot 项目中集成 FFmpeg,并实现一些常见的应用场景。 2、为什…

推荐一款智能三防手机:IP68+天玑6300+PoC对讲+夜视

在户外探险、工业巡检及应急通信等专业领域,传统智能手机往往难以应对复杂苛刻的环境挑战。智能三防手机凭借其坚固的机身、专业的防护能力及定制化功能,成为众多行业用户的可靠工具。本文将深入解析一款集IP68防护、天玑6300处理器、PoC公网对讲及夜视等…

ego(4)---检测B样条轨迹的障碍物进入点与退出点

障碍物进出点检测的作用在经过 B 样条的控制点采样后,接下来是绕障的环节,绕障使用的是 Astar ,但在使用 Astar 之前,需要进行障碍物进出点的检测与标记。通俗点讲,这部分的作用就是为 Astar 绕障碍做前置准备。检测进…

在springboot中使用mock做controller层单元测试,请求示例包括GET(带参数)、POST(带请求头)、下载文件、上传文件等

以下是SpringBoot中使用MockMvc进行Controller层单元测试的完整示例,涵盖GET带参数、POST带请求头、文件下载和文件上传等场景: GET请求测试(带路径参数) @Test void testGetWithPathParam() throws Exception {mockMvc.perform(MockMvcRequestBuilders.

领码SPARK融合平台 · TS × Java 双向契约:构建稳定可演进的全栈系统——落地篇|配置即契约,守卫即护栏

系列总引 本系列致力于构建可复制、可演进的低代码平台类型治理闭环,从原理到落地、AI 驱动到性能治理。落地篇聚焦工程实践,通过“契约单源 → 自动生成 → 前后端守卫协同 → CI/CD 管控”的完整流水线,将原理篇的类型方法论落到生产环境中…

Gradio全解11——Streaming:流式传输的视频应用(8)——Gemini Live API:实时音视频连接

Gradio全解11——Streaming:流式传输的视频应用(8)——Gemini Live API:实时音视频连接11.8 Gemini Live API:实时音视频连接11.8.1 Live API——入门1. Live API技术与功能介绍2. 选择音频生成架构和实施方案3. 异步发…

事务学习总结

目录 事务四大特性 事务四种隔离级别 事务七种传播行为 事务四大特性 原子性Atomicity 要么同时成功,要么同时失败。事务一旦发生失败就会回滚到原来最初的样子,仿佛没有发生过一样 一致性Consistency 事务处理前后,数据完整性要保持一…

JavaWeb--day4--WebHttp协议Tomcat

(以下内容全部来自上述课程及课件) 这里maven我学过了,可见:Maven项目管理–基础篇,所以跳过 SpringBootWeb 1. 需求 需求:基于SpringBoot的方式开发一个web应用,浏览器发起请求/hello后&…

网络相关知识整理

负载均衡负载均衡(Load Balancing)是一种分布式系统技术,核心作用是将网络流量、计算任务或数据请求均匀分配到多个服务器(或资源节点),避免单个节点因负载过高而性能下降或崩溃,从而提升系统的…

C++(继承和多态)

目录 访问权限: 继承: 示例: 构造和析构顺序: 多态: 示例: 非虚函数重写: 虚函数: 示例: 纯虚函数: 继承是C中面向对象编程的核心特性之一&#xf…

07_Softmax回归、损失函数、分类

1. Softmax回归 ① Softmax回归虽然它的名字是回归,其实它是一个分类问题。2. 回归VS分类3. Kaggle分类问题4. 回归到分类5. 交叉熵损失6. 总结7. 损失函数 ① 三个常用的损失函数 L2 loss、L1 loss、Huber’s Robust loss。8. L2 Loss ① 蓝色曲线为当y0时&#xf…

UFO²:微软推出的新一代桌面 Agent 操作系统,深度整合 Windows 与智能自动化

本文转载自:https://www.hello123.com/ufo ** 一、微软 UFO:Windows 桌面智能体操作系统的革新与实战解析 💻 微软 UFO(Unified Functional Optimization Operating System)是微软在 2025 年对其开源智能体系统 Agen…

C语言入门指南:字符函数和字符串函数

目录 前言: 一. 字符分类函数:精准识别字符的“身份” 1.1 ​​​​​​​核心函数 1.2 经典应用示例: 二、 字符转换函数:优雅地改变字符形态 三、strlen:计算长度的基石与无符号陷阱 3.1 关键特性 3.2 致命陷…

闪电科创-交通信号灯仿真SUMO

闪电科创计算机人工智sci/ei会议/ccf/核心,擅长机器学习,深度学习,神经网络,语义分割等计算机视觉,精通大小论文润色修改,代码复现,创新点改进等等

2025智能制造研发效率提升指南:从“项目-流程-数据”闭环看工具选型

一、引言:12年智能制造老兵的一线观察我在智能制造领域从业12年,先后主导过5家制造企业的研发流程数字化转型,从汽车零部件到高端装备制造,见证了太多研发团队因工具选型不当导致的效率损耗:项目进度卡在审批流程里、测…

spring中case一直返回else中的值-问题和原理详解

目录 案例背景 问题现象 问题根源 解决过程 最终结论 经验总结 案例背景 在基于 Spring Boot MyBatis 的项目中,需要通过 SQL 的 CASE WHEN 语句生成 user_Name字段(表示是否有关联用户名称,1 为有关联,0 为无关联&#xf…

Apache IoTDB V1.3.5 发布|优化加密算法,优化内核稳定性,修复社区反馈问题

Release AnnouncementVersion 1.3.5 Apache IoTDB V1.3.5 已经发布!V1.3.5 作为之前 1.3.x 的 bugfix 版本升级,主要调整用户密码加密算法,进一步强化数据访问安全,同时优化内核稳定性,修复社区反馈问题。欢迎点击阅读…