文章标题
- 一、Qwen-Image-Edit
- 1.ComfyOrg Qwen-Image-Edit 直播回放
- 2.Qwen-Image-Edit ComfyUI 原生工作流示例
- 2.1 工作流文件
- 2.2 模型下载
- 3.3 按步骤完成工作流
一、Qwen-Image-Edit
Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本,基于20B模型进一步训练,支持精准文字编辑和语义/外观双重编辑能力。
Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本。它基于20B的Qwen-Image模型进一步训练,成功将Qwen-Image的文本渲染特色能力拓展到编辑任务上,以支持精准的文字编辑。此外,Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL(获取视觉语义控制)和VAE Encoder(获得视觉外观控制),以同时获得语义/外观双重编辑能力。
模型特性
特性包括:
- 精准文字编辑: Qwen-Image-Edit支持中英双语文字编辑,可以在保留文字大小/字体/风格的前提下,直接编辑图片中文字,进行增删改。
- 语义/外观 双重编辑: Qwen-Image-Edit不仅支持low-level的视觉外观编辑(例如风格迁移,增删改等),也支持high-level的视觉语义编辑(例如IP制作,物体旋转等)
- 强大的跨基准性能表现: 在多个公开基准测试中的评估表明,Qwen-Image-Edit 在编辑任务中均获得SOTA,是一个强大的图像生成基础模型。
官方链接:
- GitHub 仓库
- Hugging Face
- ModelScope
1.ComfyOrg Qwen-Image-Edit 直播回放
2.Qwen-Image-Edit ComfyUI 原生工作流示例
请确保你的 ComfyUI 已经更新。- ComfyUI 下载
- ComfyUI 更新教程
本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。
如果加载工作流时有节点缺失,可能原因有:
- 你用的不是最新开发版(nightly)。
- 你用的是稳定版或桌面版(没有包含最新的更新)。
- 启动时有些节点导入失败。
2.1 工作流文件
更新 ComfyUI 后你可以从模板中找到工作流文件,或者将下面的工作流拖入 ComfyUI 中加载
下载下面的图片作为输入
https://raw.githubusercontent.com/Comfy-Org/example_workflows/refs/heads/main/image/qwen/qwen-image-edit/input.png
2.2 模型下载
所有模型都可在 Comfy-Org/Qwen-Image_ComfyUI 或 Comfy-Org/Qwen-Image-Edit_ComfyUI 找到
Diffusion model
- qwen_image_edit_fp8_e4m3fn.safetensors
LoRA
- Qwen-Image-Lightning-4steps-V1.0.safetensors
Text encoder
- qwen_2.5_vl_7b_fp8_scaled.safetensors
VAE
- qwen_image_vae.safetensors
安装aria2快速下载模型,几乎能将我家1000M的宽带跑满,每秒80~90M
,接下来的介绍模型都会给出安装命令。
apt install aria2
aria2c https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/resolve/main/split_files/diffusion_models/qwen_image_edit_fp8_e4m3fn.safetensors -o ComfyUI/models/diffusion_models/qwen_image_edit_fp8_e4m3fn.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/lightx2v/Qwen-Image-Lightning/resolve/main/Qwen-Image-Lightning-4steps-V1.0.safetensors -o ComfyUI/models/loras/Qwen-Image-Lightning-4steps-V1.0.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/resolve/main/split_files/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors -o ComfyUI/models/text_encoders/qwen_2.5_vl_7b_fp8_scaled.safetensors --auto-file-renaming=false --allow-overwrite=falsearia2c https://huggingface.co/Comfy-Org/Qwen-Image_ComfyUI/resolve/main/split_files/vae/qwen_image_vae.safetensors -o ComfyUI/models/vae/qwen_image_vae.safetensors --auto-file-renaming=false --allow-overwrite=false
小技巧:你要是打不开https://huggingface.co
,可以将其换成为https://hf-mirror.com/
试一试
Model Storage Location
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_edit_fp8_e4m3fn.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
3.3 按步骤完成工作流
- 模型加载
- 确保
Load Diffusion Model
节点加载了qwen_image_edit_fp8_e4m3fn.safetensors
- 确保
Load CLIP
节点中加载了qwen_2.5_vl_7b_fp8_scaled.safetensors
- 确保
Load VAE
节点中加载了qwen_image_vae.safetensors
- 确保
- 图片加载
- 确保
Load Image
节点中上传了用于编辑的图片
- 确保
- 提示词设置
- 在
CLIP Text Encoder
节点中设置好提示词
- 在
- Scale Image to Total Pixels 节点会将你输入图片缩放到总像素为 一百万像素,
- 主要是避免输入图片尺寸过大如 2048x2048 导致的输出图像质量损失问题
- 如果你很了解你输入的图片尺寸,你可以使用
Ctrl+B
绕过这个节点
- 如果你要使用 4 步 Lighting LoRA 来实现图片生成的提速,你可以选中
LoraLoaderModelOnly
节点,然后按Ctrl+B
启用该节点 - 对于 Ksampler 节点的
steps
和cfg
设置,我们在节点下方增加了一个笔记,你可以测试一下最佳的参数设置 - 点击
Queue
按钮,或者使用快捷键Ctrl(cmd) + Enter(回车)
来运行工作流