ComfyUI+阿里Wan2.1+内网穿透技术:本地AI视频生成系统搭建实战

文章目录

    • 前言
    • 1.软件准备
      • 1.1 ComfyUI
      • 1.2 文本编码器
      • 1.3 VAE
      • 1.4 视频生成模型
    • 2.整合配置
    • 3. 本地运行测试
    • 4. 公网使用Wan2.1模型生成视频
      • 4.1 创建远程连接公网地址
    • 5. 固定远程访问公网地址
    • 总结

前言

各位技术爱好者,今天为您带来一组创新性的AI应用方案!我们将演示如何在Windows系统中搭建ComfyUI运行环境,并成功整合阿里巴巴最新研发的Wan2.1开源模型。通过简单的文本输入操作,即可激活个人计算机的AI创作能力,实现专业级视频生成效果。特别值得一提的是,结合cpolar内网穿透技术,您可突破网络限制实现远程控制,完全无需配置公网IP地址或部署云端服务器。

近期,阿里巴巴推出重磅开源项目——Wan 2.1创新模型。这款完全免费的解决方案具备惊人的运行效率,即便在普通PC端也能流畅执行。其生成的视频内容质量可与主流商业模型相媲美,无论是文本生成动态影像还是静态图像转化动画,Wan 2.1都能提供专业级的处理能力,助您快速掌握前沿AI技术应用。

image-20250328170652107

1.软件准备

1.1 ComfyUI

首先访问ComfyUI的Github下载对应操作系统版本,本例使用Windows系统进行演示,全部所需软件资源链接我会放在文章末尾。

ComfyUI Github:https://github.com/comfyanonymous/ComfyUI

image-20250328115533255

选择免安装版本(本例以适用于N卡的免安装版本0.3.27为例演示)

image-20250328115623927

下载后解压到已定义路径,然后继续下载其他软件:

image-20250328131010965

1.2 文本编码器

现在需要下载文本编码器,大家可以根据显卡内存进行选择,本例中以fp8量化版进行演示,适用于低于8G的显卡,如果显卡内存高于12G,可以选择fp16这个,生成后的视频精度会更高。

文本编码器下载地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

image-20250328134032601

1.3 VAE

然后需要下载VAE,点击download即可:

image-20250328134119724

VAE下载地址:split_files/vae/wan_2.1_vae.safetensors · Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

1.4 视频生成模型

最后还需要下载Wan2.1视频生成模型,如果显卡配置较好,可以选择最完整的32G的模型。本例中以相对显卡要求较低的wan2.1_t2v_1.3B_fp16.safetensors模型进行演示:

image-20250328134504175

注意:建议使用 fp16 版本而不是 bf16 版本,因为它们会产生更好的结果。

质量等级(从高到低):fp16 > bf16 > fp8_scaled > fp8_e4m3fn

视频生成模型下载地址:Comfy-Org/Wan_2.1_ComfyUI_repackaged at main

2.整合配置

现在要把上边准备好的编码器、模型等整合到ComfyUI中,然后导入工作流文件,就能使用它来生成视频了。

首先,把文本编码器 umt5_xxl_fp8_e4m3fn_scaled.safetensors 放入 ComfyUI/models/text_encoders/

image-20250328135303505

image-20250328135816803

第二步,将VAE文件 wan_2.1_vae.safetensors 放入 ComfyUI/models/vae/

image-20250328140305746

第三步,将 Wan 2.1 模型 放入ComfyUI/models/diffusion_models/

image-20250328140453169

最后一步,下载文字转视频所需的 Json 格式的工作流,右键另存为到桌面即可,稍后打开ComfyUI时拖入。

下载地址:comfyanonymous.github.io/ComfyUI_examples/wan/text_to_video_wan.json

image-20250328140802142

3. 本地运行测试

现在我们回到解压后的ComfyUI根目录,双击运行脚本:

image-20250328140956450

启动中:(启动后这个服务窗口也不要关)

image-20250328141131576

启动完毕后,会自动在浏览器打开ComfyUI的使用界面, 或者在网址栏输入 http://127.0.0.1:8188 也可以:

image-20250328141326584

image-20250328141419401

然后,将刚才下载好的 Json 格式的工作流文件直接拖入这个界面即可:

image-20250328141609344

image-20250328141649403

使用文生视频前,可以先右键保存动画模块,在模式中选择Always,这样以后生成的视频都会被自动保存下来:

image-20250328143630913

然后在编辑器中输入提示词(中英文都可以),点击运行即可启动文生视频工作流:

image-20250328142250430

例:一个小男孩在海边提足球

image-20250328143946700

默认生成的视频参数是832*480,如果需要修改可以在这里对宽度和高度进行调整:

image-20250328145040115

默认视频长度是33,如果需要修改可以在这里调整,更长的时长也需要更多的时间来生成视频:

image-20250328150414291

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4. 公网使用Wan2.1模型生成视频

现在我们已经在本地成功部署了Wan2.1模型,并通过ComfyUI工作流来使用文字生成视频了,但如果我们部署的这台电脑配置不错,使用这款大模型毫无压力,要是我们出门时,或者是想团队多人使用,打算远程调用这台电脑上部署的大模型应该怎么办呢?

很简单,我们只需要安装Cpolar内网穿透工具就能轻松实现公网环境远程访问本地部署的服务!通过它,我们可以免去复杂得本地部署过程,只需要一个公网地址就可以随时随地访问到ComfyUI中来使用Wan2.1模型来生成视频了。也无需自己注册域名购买云服务器,下面是安装cpolar步骤:

cpolar官网地址: https://www.cpolar.com

点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar。

img

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

image-20240319175308664

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

img

4.1 创建远程连接公网地址

登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理——创建隧道:

  • 隧道名称:可自定义,本例使用了: wan21 注意不要与已有的隧道名称重复
  • 协议:http
  • 本地地址:8188
  • 域名类型:随机域名
  • 地区:选择China Top
  • 高级:Http Auth:user:123(本例中用户名user 密码123)

点击保存

image-20250328151828884

创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了两个公网地址,接下来就可以在其他电脑(异地)上,使用任意一个地址在浏览器中访问即可。

image-20250328151931960

如下图所示,输入设置的用户名user及密码123(也可以不设置高级,就无需用户名密码直接登入,安全起见,建议配置密码,避免他人蹭显卡算力_

image-20250328152127049

可以看到成功实现使用公网地址异地远程访问本地部署的ComfyUI使用Wan2.1大模型!

image-20250328152237587

需要注意的是首次登录,默认显示的工作流可能不是我们刚才使用的工作流配置,点击左边菜单栏中的队列,在之前保存过的视频中,右键加载工作流,即可远程使用对应的工作流来生成视频啦!

image-20250328152609754

小结

为了方便演示,我们在上边的操作过程中使用了cpolar生成的HTTP公网地址隧道,其公网地址是随机生成的。这种随机地址的优势在于建立速度快,可以立即使用,然而,它的缺点是网址是随机生成,这个地址在24小时内会发生随机变化,更适合于临时使用。

如果有长期远程访问本地部署的ComfyUI使用Wan2.1大模型或者其他本地服务的需求,但又不想每天重新配置公网地址,还想地址好看又好记,那我推荐大家选择使用固定的二级子域名方式来远程访问,带宽会更快,使用cpolar在其他用途还可以保留多个子域名,支持多个cpolar在线进程。(根据cpolar套餐而定)

5. 固定远程访问公网地址

由于以上使用cpolar所创建的隧道使用的是随机公网地址,24小时内会随机变化,不利于长期远程访问。因此我们可以为其配置二级子域名,该地址为固定地址,不会随机变化。

注意需要将cpolar套餐升级至基础套餐或以上,且每个套餐对应的带宽不一样。【cpolar.cn已备案】

登录cpolar官网,点击左侧的预留,选择保留二级子域名,地区选择china top,然后设置一个二级子域名名称,自定义即可,然后填写备注信息,点击保留。

image-20250328153007281

保留成功后复制保留的二级子域名地址:mywan21

image-20250328153056392

登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道wan21,点击右侧的编辑

image-20250328153132963

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名
  • 地区: China TOP

点击更新

image-20250328153226764

更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。

image-20250328153300357

最后,我们使用固定的公网地址访问 ComfyUI 可以看到访问成功,一个永久不会变化的远程访问方式即设置好了,同样需要输入在高级中配置的用户名和密码登录。

image-20250328153357978

image-20250328153538574

总结

通过本次技术实践,相信各位已经掌握了基于公网地址实现远程操控本地Wan2.1模型的核心要领。这个创新性解决方案不仅支持通过专属访问通道与协作团队实时共享,更能显著提升跨地域协作效率。对于独立开发者而言,该系统同样具备卓越的远程接入能力,可无缝适配各类终端设备。

本方案完整整合了ComfyUI平台、Wan2.1模型及cpolar内网穿透技术三重优势,构建出完整的AI创作生态体系。这套工具组合彻底解决了AI创作的时空限制,让高质量视频生成突破物理环境约束,实现真正的全天候、全场景创作自由。

使用软件资源链接:https://pan.baidu.com/s/1N46hOSsSsVr848cWXxTVzA?pwd=6666

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/83165.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

n8n:技术团队的智能工作流自动化助手

在当前数字化时代,自动化已经成为提高效率和减轻人工工作负担的一大推动力。今天,我们要为大家介绍一款极具潜力的开源项目——n8n,它不仅拥有广泛的应用场景,还具备内置AI功能,能够完全满足技术团队的高效工作需求。n8n的出现,为技术团队提供了自由编程与快速自动化构建…

1,QT的编译教程

目录 整体流程: 1,新建project文件 2,编写源代码 3,打开QT的命令行窗口 4,生成工程文件(QT_demo.pro) 5,生成Make file 6,编译工程 7,运行编译好的可执行文件 整体流程: 1,新建project文件 新建文本文件,后缀改为.cpp 2,编写源代码

深度学习论文: FastVLM: Efficient Vision Encoding for Vision Language Models

深度学习论文: FastVLM: Efficient Vision Encoding for Vision Language Models FastVLM: Efficient Vision Encoding for Vision Language Models PDF: https://www.arxiv.org/abs/2412.13303 PyTorch代码: https://github.com/shanglianlm0525/CvPytorch PyTorch代码: https…

十一、【核心功能篇】测试用例管理:设计用例新增编辑界面

【核心功能篇】测试用例管理:设计用例新增&编辑界面 前言准备工作第一步:创建测试用例相关的 API 服务 (src/api/testcase.ts)第二步:创建测试用例编辑页面组件 (src/views/testcase/TestCaseEditView.vue)第三步:配置测试用例…

三、web安全-信息收集

1、信息搜集的重要性 (1)明确攻击面 信息搜集能让渗透测试人员清晰地勾勒出目标系统的边界,包括其网络拓扑结构、开放的服务端口、运行的软件系统等。例如,通过信息搜集发现目标企业除了对外提供官网服务外,还有一个…

生活小记啊

最近生活上的事情还是蛮多的,想到哪写到哪。 工作 三月的某个周六,正在加班写技术方案,大晚上写完了听到调动通知,要去新的团队了。 还是蛮不舍的,看着产品从无到有,一路走过来,倾注了不少感…

vue-08(使用slot进行灵活的组件渲染)

使用slot进行灵活的组件渲染 作用域slot是 Vue.js 中的一种强大机制,它允许父组件自定义子组件内容的呈现。与仅向下传递数据的常规 props 不同,作用域 slot 为父级提供了一个模板,然后子级可以填充数据。这提供了高度的灵活性和可重用性&am…

MySQL索引与性能优化入门:让查询提速的秘密武器【MySQL系列】

本文将深入讲解 MySQL 索引的底层原理、常见类型、使用技巧,并结合 EXPLAIN 工具分析查询执行计划,配合慢查询日志识别瓶颈,逐步建立起系统的 MySQL 查询优化知识体系。适合有一定基础、希望在数据量增长或面试中脱颖而出的开发者阅读。 一、…

C 语言开发中常见的开发环境

目录 1.Dev-C 2.Visual Studio Code 3.虚拟机 Linux 环境 4.嵌入式 MCU 专用开发环境 1.Dev-C 使用集成的 C/C 开发环境(适合基础学习),下载链接Dev-C下载 - 官方正版 - 极客应用 2.Visual Studio Code 结合 C/C 扩展 GCC/MinGW 编译器&#xff0c…

STM32G4 电机外设篇(二) VOFA + ADC + OPAMP

目录 一、STM32G4 电机外设篇(二) VOFA ADC OPAMP1 VOFA1.1 VOFA上位机显示波形 2 ADC2.1 用ADC规则组对板载电压和电位器进行采样 3 OPAMP(运放)3.1 结合STM32内部运放和ADC来完成对三相电流的采样3.2 运放电路分析 附学习参考…

再见Notepad++,你好Notepad--

Notepad-- 是一款国产开源的轻量级、跨平台文本编辑器,支持 Window、Linux、macOS 以及国产 UOS、麒麟等操作系统。 除了具有常用编辑器的功能之外,Notepad-- 还内置了专业级的代码对比功能,支持文件、文件夹、二进制文件的比对,支…

跳动的爱心

跳动的心形图案&#xff0c;通过字符打印和延时效果模拟跳动&#xff0c;心形在两种大小间交替跳动。 通过数学公式生成心形曲线 #include <stdio.h> #include <windows.h> // Windows 系统头文件&#xff08;用于延时和清屏&#xff09; void printHeart(int …

2.2HarmonyOS NEXT高性能开发技术:编译优化、内存管理与并发编程实践

HarmonyOS NEXT高性能开发技术&#xff1a;编译优化、内存管理与并发编程实践 在HarmonyOS NEXT全场景设备开发中&#xff0c;高性能是跨端应用体验的核心保障。本章节聚焦ArkCompiler编译优化、内存管理工具及多线程并发编程三大技术模块&#xff0c;结合实战案例解析底层实现…

C# 类和继承(使用基类的引用)

使用基类的引用 派生类的实例由基类的实例和派生类新增的成员组成。派生类的引用指向整个类对象&#xff0c;包括 基类部分。 如果有一个派生类对象的引用&#xff0c;就可以获取该对象基类部分的引用&#xff08;使用类型转换运算符把 该引用转换为基类类型&#xff09;。类…

如何在腾讯云 OpenCloudOS 上安装 Docker 和 Docker Compose

从你提供的 /etc/os-release 文件内容来看&#xff0c;你的服务器运行的是 OpenCloudOS 9.2。这是一个基于 CentOS 和 RHEL 的开源操作系统&#xff0c;因此它属于 CentOS/RHEL 系列。 关键信息总结 操作系统名称&#xff1a;OpenCloudOS版本&#xff1a;9.2ID&#xff1a;op…

趋势直线指标

趋势直线副图和主图指标&#xff0c;旨在通过技术分析工具帮助交易者识别市场趋势和潜在的买卖点。 副图指标&#xff1a;基于KDJ指标的交易策略 1. RSV值计算&#xff1a; - RSV&#xff08;未成熟随机值&#xff09;反映了当前收盘价在过去一段时间内的相对位置。通过计算当前…

FEMFAT许可分析的数据可视化方法

随着企业对FEMFAT软件使用的增加&#xff0c;如何有效地管理和分析许可数据成为了关键。数据可视化作为一种强大的工具&#xff0c;能够帮助企业直观地理解FEMFAT许可的使用情况&#xff0c;从而做出更明智的决策。本文将介绍FEMFAT许可分析的数据可视化方法&#xff0c;并探讨…

AMBER软件介绍

AMBER软件介绍 AMBER&#xff08;Assisted Model Building with Energy Refinement&#xff09;是一套广泛应用于分子动力学&#xff08;MD&#xff09;模拟和生物分子结构分析的软件工具集&#xff0c;尤其在蛋白质、核酸、多糖等生物大分子的模拟中表现突出。以下是关于AMBE…

GoogLeNet网络模型

GoogLeNet网络模型 诞生背景 在2014年的ImageNet图像识别挑战赛中&#xff0c;一个GoogLeNet的网络架构大放异彩&#xff0c;与VGG不同的是&#xff0c;VGG用的是3*3的卷积&#xff0c;而GoogLeNet从1*1到7*7的卷积核都用&#xff0c;也就是使用不同大小的卷积核组合。 网络…

Free2AI:企业智能化转型的加速器

随着数字化与智能化的深度交融&#xff0c;企业的竞争舞台已悄然转变为数据处理能力和智能服务水平的竞技场。Free2AI以其三大核心功能——智能数据采集、多格式文档解析、智能FAQ构建&#xff0c;为企业铺设了一条从数据洞察到智能服务的全链路升级之路&#xff0c;成为推动企…