ComfyUI——舒服地让大模型为我所用

主页:ComfyUI | 用AI生成视频、图像、音频

https://github.com/comfyanonymous/ComfyUI

安装环境

我的环境是mac,芯片为M4pro。首先从github中下载工程,clone失败就直接下载zip压缩包。在model文件夹中,可以看到很多大名鼎鼎的模型,如lora,controlnet。

其中一个依赖环境是av,PyAV 是一个强大的库,用于处理视频和音频流(基于 FFmpeg)。PyAV 依赖 FFmpeg,如果系统未安装 FFmpeg,可能会报错。Conda 会自动处理 FFmpeg 依赖

conda install -c conda-forge av
OMP: Error #15: Initializing libomp.dylib, but found libomp.dylib already initialized.
OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program.

使用命令:find / -name "libomp.dylib" 2>/dev/null
发现虚拟环境下有很多个:

I/lib/libomp.dylib/anaconda3/envs/comfUI/lib/python3.12/site-packages/torch/lib/libomp.dylib/anaconda3/envs/comfUI/lib/python3.12/site-packages/skimage/.dylibs/libomp.dylib

但是更改环境变量也没解决;

import os
os.environ['DYLD_LIBRARY_PATH'] = f"{os.environ['CONDA_PREFIX']}/lib"

最终是靠conda重新安装torch解决。

conda uninstall numpy scipy mkl torch # 卸载可能依赖 MKL 的包
conda install numpy scipy mkl  torch # 重新安装(conda 会自动处理依赖)

requirements.txt中的comfyui-frontend-package则需要pip安装

下载模型

打开网页就可以看到一个可视化的工作流。工作流有一些模板可以浏览。

这几个模板其实就是一些jpg,只不过在图片的metadata里面保存了真正决定workflow的JSON。

点击Lora会加载工作流,刚开始会弹出提示框,缺少模型,不过没关系,可以点击下载就好了:

下载需要科学上网。三个模型都以safetensors结尾。下载好的 dreamshaper_8.safetensors  and 放到ComfyUI/models/checkpoints下, blindbox_V1Mix and MoXinV1放到ComfyUI/models/loras文件夹下。dreamshaper是stable diffusion的checkpoint model,是很大的模型,所以看大小有2.13GB,而Lora只有151.1MB。

可以看到这个工作流同时使用了两个Lora,模板自带的notes解释了为什么需要两个lora:blindbox_V1Mix and MoXinV1,因为这样可以得到更balance的结果:

 blindbox_V1Mix and MoXinV1.blend

大模型除了dreamshaper,还有Stable diffusion v1.4,Stable diffusion v1.5,Realistic Vision,majicMIX realistic,Deliberate v2,F222等。dreamshaper生成的是近似于AnythingV5(属于SDXL模型)的漫画和majicMIX realistic逼真之间的形象:

启动

模型准备好之后就可以运行了,会比较慢,网页的标签页上会显示进度。

这是我生成的一幅图:

对应的提示词是:

upperbody shot, 1girl,solo,chibi,long hairs, happy, laugh, hugging a teddy bear, looking at viewers, dancing stand, cute, soft color, flowers in background, many flowers, among flowers, best quality, highres, delicate details,

上半身特写,一位女孩,单人,Q版(或“迷你角色”/“简笔画风格可爱小人”,根据“chibi”具体语境调整),长发,面带笑容,开怀大笑,抱着泰迪熊,注视着观众,舞姿站立,可爱,柔和色调,背景有花朵,繁花似锦,置身花丛,最佳画质,高分辨率,细节精致

对比之下,生成的数目不对,手里的也不是泰迪熊。

除了正向的提示词,还有负向的:

(worst quality, low quality:1.4), (bad anatomy), text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, blurry, deformed face

在提示词之外,还可以控制图像尺寸,采样器,步数等参数:

reference:

1.怎么使用Stable diffusion中的models-腾讯云开发者社区-腾讯云

2.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/918182.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/918182.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Visual Studio】使用VS调试(Debug)

确保在Debug模式下而不是Release 打断点(break point) 直接在有代码的行前单击,会出现红色的点(再次单击会取消);或者光标停留在某行,按F9 这意味着程序当执行到这一行时会终止 在打完断点后点击”本地Windows调试器“或者按F5 往下翻会有代码…

B2.0:对硬件学习的一些个人心得感悟

对于硬件学习,所有人都会迷茫的找不到学习的路径和方向,都是自我摸索或者老师带领或者其他情况,而我倒是没有机会接触到现实的老师带我领进这个门,自然走的弯路比较多,所以引申出这篇文章,来聊聊硬件学习的…

Cursor设置

一:设置 Port: 7890TUN Mode:开启二:Editor Settings值为http://127.0.0.1:7890三:Cursor 测试一下

Windows下使用PyInstaller打包PyQt项目

在 Windows 环境下,使用 PyQt 开发的项目可以通过多种工具打包成 可执行文件(.exe),以下是几种常见的方法及详细步骤:1. 使用 PyInstallerPyInstaller 是最常用的 Python 打包工具,支持 PyQt5/PyQt6/PySide…

AI大语言模型在生活场景中的应用日益广泛,主要包括四大类需求:文本处理、信息获取、决策支持和创意生成。

一、AI大语言模型生活应用全景图(Mermaid流程图)graph TDA[生活小事需求] --> B{需求分类}B --> C[文本处理类]B --> D[信息获取类]B --> E[决策支持类]B --> F[创意生成类]C --> C1[邮件写作]C --> C2[内容润色]C --> C3[文档总…

物奇路由器Wi-Fi芯片荣膺2025中国创新IC-强芯领航奖,并亮相第五届RISC-V中国峰会

近日,第五届中国集成电路设计创新大会在苏州举办,物奇携多款高性能网络通信与终端人工智能芯片亮相展会,其中首颗路由器Wi-Fi6芯片WQ9301凭借独特的架构创新和领先的性能优势,在国产IC强芯评选中脱颖而出,荣膺2025中国…

【已解决】npm install报错

~/autodl-tmp/App/magic_conch_frontend# npm install报错内容:WARN EBADENGINE Unsupported engine { npm WARN EBADENGINE package: vitejs/plugin-vue5.1.4, npm WARN EBADENGINE required: { node: ^18.0.0 || >20.0.0 }, npm WARN EBADENGINE current: { no…

IPC总结

IPC 是 Inter-Process Communication(进程间通信)的缩写,指的是操作系统中不同进程之间传递数据、交换信息或同步行为的机制。由于进程在内存中拥有独立的地址空间,无法直接访问彼此的内存,因此需要通过操作系统提供的…

java之父-新特性

目录 一.函数式接口Functional Interface 1. Supplier接口 --供给型接口 2. Consumer接口 --消费型接口 3.Function接口 --转换型接口 4. Predicate接口--断言型接口 5. Comparator接口--比较器接口 一.函数式接口Functional Interface 只有一个抽象方法的接口&#xff…

GPT-5的多模态能力如何?

GPT-5的多模态能力如何?概述问题1-非整点闹钟问题2-数数问题一问题3-数数问题二小结概述 2025年,8月8日凌晨,OpenAI 发布了 GPT-5,让我们看看其多模态能力如何,用之前大模型无法解决的题目测试,数数问题时…

多模态RAG赛题实战--Datawhale AI夏令营

参考自科大讯飞AI大赛(多模态RAG方向) - Datawhale 赛题意义: 我们正处在一个信息爆炸的时代,但这些信息并非以整洁的纯文本形式存在。它们被封装在各种各样的载体中:公司的年度财报、市场研究报告、产品手册、学术论…

SQL Server 创建 PostgreSQL 数据库 链接服务器指南

SQL Server 创建 PostgreSQL 数据库 链接服务器指南SQL Server 创建 PostgreSQL 数据库 链接服务器指南一、准备工作二、创建链接服务器三、测试连接四、常见问题解决五、注意事项SQL Server 创建 PostgreSQL 数据库 链接服务器指南 一、准备工作 安装 PostgreSQL ODBC 驱动&a…

李宏毅深度学习教程 第16-18章 终身学习+网络压缩+可解释性人工智能

【2025版】44、第十四节 机器终身学习 一 为什么今日的人工智能A_哔哩哔哩_bilibili 【2025版】42、第十三节 神经网络压缩 一 类神经网络剪枝PruA_哔哩哔哩_bilibili 【2025版】30、第九节 机器学习的可解释性 上 – 为什么神经网络可以正_哔哩哔哩_bilibili 目录 1. 终生…

LiveQing视频RTMP推流视频点播服务功能-云端录像支持按时间段下载录像时间段下载视频mp4

LiveQing视频RTMP推流视频点播服务功能-云端录像支持按时间段下载录像时间段下载视频mp41、云端录像2、配置云端录像3、查看云端录像3、列表模式4、时间段下载5、时间段下载接口6、RTMP推流视频直播和点播流媒体服务1、云端录像 LiveQing 支持服务器集中录像,将rtm…

Spark在什么情况下CBO才会判断失误,如何避免

在 Spark 中,CBO(基于成本的优化器,Cost-Based Optimizer)通过分析表的统计信息(如行数、列基数、数据分布等)计算不同执行计划的“成本”,并选择成本最低的计划。但在以下场景中,CB…

【第12话:感知算法基础4】图像分割:深度学习图像分割模型介绍入门及常用模型详解

深度学习图像分割模型介绍入门及常用模型详解 图像分割是计算机视觉的核心任务,旨在将图像划分为语义区域。随着深度学习的发展,分割模型在精度和效率上取得重大突破。以下按技术演进顺序详解主流模型:1. FCN(全卷积网络&#xff…

AI 大模型企业级应用落地挑战与解决方案

引言:AI 大模型的企业价值与落地困境近年来,以 GPT-4、Claude 3、文心一言为代表的大语言模型(LLM)展现出惊人的自然语言理解与生成能力,吸引了众多企业的关注。据 Gartner 预测,到 2025 年,40%…

微服务如何保证系统高可用?

今天我们来探讨一个综合性但至关重要的话题:给你一个微服务应用,你该如何系统性地保证其高可用性?在互联网技术岗的面试中,高并发、高可用和大数据通常被视为衡量候选人经验的三大黄金标准。但说实话,是否拥有真正的高…

推理路径的动态调控:让大模型学会“恰到好处”的思考

当前大型语言模型(LLM)通过思维链(CoT)提升复杂任务推理能力,但研究表明其推理路径存在严重冗余——例如反复验证或无效思维跳跃,导致计算资源浪费和“幻觉”增加。论文:Test-time Prompt Inter…

springboot 2.4跨域变化和swagger结合的问题

前言 最近升级老项目,springboot2.2升级2.x最新版,升级项目本身升级很正常,毕竟springboot升级3.x以下,升级3.x需要spring6.x,需要jdk17.但是升级的项目在自测时正常,一旦真正测试就报跨域问题了。排查才发…