【AI学习笔记】Coze平台实现生成小红书热门多图笔记

背景前摇&原视频教程:

最近总是在小红书上刷到多图组成的养生小妙招、效率提升小tips、退休奶奶疗愈语录等等这样的图文笔记,而且人物图像一眼就是AI画的。
当时我以为这个排版和文字是人工的,就让AI保持角色一致性画了下图,没想到在B站刷到了实现教程,才知道Coze平台已经支持很完善的一键出笔记的工作流了。

B站上优秀的视频教程:

对比了我主动搜索+推荐算法推送的教程,最后跟着UP @在下李君陌 的教程学完了整个工作流,确实成功实现了出图文笔记的效果。
原视频链接:https://www.bilibili.com/video/BV1Xa5QzpEKM/?spm_id_from=333.1007.top_right_bar_window_history.content.click&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
传送门
在这里插入图片描述而且这个UP特别好的是,把用到的演示文稿直接就放在了简介里,直接飞书就可以打开,无需再三连私信求资料,最后被卖课的反复骚扰,简直就是超级良心。在这里插入图片描述
因为原UP的视频已经很详细了,大家跟着学一定能顺利实践出真知,我就不再赘述UP的视频里面已经介绍的如何搭建工作流的相关过程了。本文只分享一些我个人遇到的问题和心得。

跟完教程后生成的图文笔记预期效果:

我这里选定的主题是“香港旅游”,想着顺带帮亲戚做个旅游攻略。
在这里插入图片描述在这里插入图片描述在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
封面图+5张简单的图文笔记,效果还不错~

学习准备:

1.9.9的氪金费用,因为这个工作流有很多图像生成节点,可能Coze平台默认的额度不够用,必要时需要氪金开个个人进阶版,或者增购资源包。在这里插入图片描述
2.至少两个小时的学习时间,原UP视频长约一个半小时,加上大家自己摸索、连图、调试的时间,如果是Coze新手,需要的时间会更长。
3.一些Coze平台的基础知识,至少知道如何搭建工作流和传递参数,让一个工作流完整跑起来。如果对Coze完全一无所知,建议先看Coze官方视频教程:传送门
https://www.bilibili.com/video/BV1zC35eFEyN?spm_id_from=333.788.videopod.sections&vd_source=cdfd0a0810bcc0bcdbcf373dafdf6a82
4.其他原视频UP在讲解过程中要求准备的东西,比如飞书演示文档(后面复制提示词会用到,或者实在没有的话,截图OCR文字识别也可),放在桌面上的几张组成模板用的底图。
在这里插入图片描述

正文:

大家如果顺利跟着UP的视频走完了全流程以后,应该工作流会长下面这样:是一个能生成5张图文+一个主图封面的工作流,并且每个页面又有两张组成图片。在这里插入图片描述在这里插入图片描述
在这里插入图片描述

1.图像调用节点受限问题:

如果按照上面这样连接节点,逻辑是没问题的,但是调用起来会发现工作流会被中途中断,因为同时调用的图像节点太多了。在这里插入图片描述
中道崩殂不说,还白烧了不少token,简直让人心疼。
在这里插入图片描述
B站视频评论区也有码友遇到这个问题,给出的解决方法是拆成几个工作流调用。
在这里插入图片描述
这样应该也可行,我没有自己尝试过,不过我采用了另一种方法来规避这个问题。
那就是——把工作流连成一条长直线!
在这里插入图片描述
也就是说,把第一页的大模型节点和封面的画板节点连起来,再把第一页的画板节点和第二页的大模型节点连接起来。在这里插入图片描述

在这里插入图片描述可以理解为,原作者那样的结构,封面、不同页之间是并联关系。大模型节点生成提示词以后,同时在生成封面和五页内容的图,这样就导致图像节点调用过多,超限制了。
在这里插入图片描述
上图中单个浅蓝色的节点里面,构成了能组成一张单图的基本逻辑:在这里插入图片描述
而我把封面和不同页的生成顺序变成了串联关系,先生成封面,再生成第一页,然后是第二页,单张图文笔记生成的逻辑并没有改变,所以不影响出图效果。在这里插入图片描述
每个浅蓝色节点生成图片的逻辑依旧是这样,没有改变:
在这里插入图片描述
因为只要通路是连着的,后续的节点可得到前面任意节点的输出,所以并不影响每一页的大模型节点提取对应的小技巧,也不影响最后结束节点一次性输出五张图。在这里插入图片描述在这里插入图片描述
这样虽然运行速度稍微慢一些,但是一个工作流内就可以实现生成全部图文,并且不会报图像节点受限的问题。
当然,如果觉得这样摆成一长条不太美观的话,也可把生成单张页面的几个节点按shift选中(或者鼠标左键长按拖拽框选),把他们作为一个组合(可以自行选择是否封装工作流,这里我为了清晰没用封装),拖拽成一排排的。
在这里插入图片描述
下面这样是不是就跟原视频UP的工作流比较像啦?其实在我按原UP的并联工作流改为串联逻辑以后,这就是这个串联工作流最初的样子。在这里插入图片描述其实我最开始演示的一条直线的工作流,就是现在这个工作流点击了“优化布局”按钮重排后,整个工作流被拉直后的结果。在这里插入图片描述
(串联工作流偶尔也会遇到执行不成功的情况,但多试几次就可以了!)

2.图片生成内容更宽泛:

原作者跟着做的模板是人类养生相关的,图片生成模型选的是“人像”,并且给了参考图,但这就导致图文笔记能生成的内容相对受限,很多图片都会画个人在中间。
但我希望做的主题是“香港旅游”,很多生成的贴士是跟旅游景点相关的,比如叮叮车、天星小轮,但是按照原来的设定,生成的很多配图主体物都是人,抠图完后基本上只剩下一个人的轮廓了,就跟我们的旅游场景不搭配。
我把所有节点选用的图像生成模型全部都改成了**“通用Pro”**,这样不但可以支持生成人像,也可以根据不同主题的提示词生成其他景物、美食等图片。通用模型画什么其实更多取决于得到什么提示词,如果前面生成提示词的大模型判断出来这个小贴士需要出现人物在画面里,通用模型也可生成。
原作者给的参考图我也去掉了,感觉有跟没有差别并不大,很多时候参考图并没有发挥其该有的作用,很多时候不但人物崩坏,还很重复,出现人长得有些相似,但是一致性又不够(就是倒像不像,很难说这俩是一个人,但又不是完全不像),画风还不统一(有的写实风,有的卡通风)、还有多手多脚、画面结构混乱等问题。
综合考虑感觉,不同小贴士之间人跟人长得一不一样并不重要,就算是养生场景,展示的路人A在泡脚,路人B在做操也没有关系。所以就让模型更自由发挥了。在这里插入图片描述
修改后,不但之前UP测试的养生、提效、告别拖延场景可适配,我想实现的旅游场景也能实现了。在这里插入图片描述在这里插入图片描述

3.实现图文效果的提示词:

这部分是我觉得很意外也很惊喜的点,我一直以为要生成这样有封面+五张图的内容,提示词会很复杂,这些一段那写一段,没想到总共就三个部分。
这里原视频作者写得就很好,并且因为其文档是公开分享的,我就直接截图了。
首先是这个最重要的大模型节点,除了决定吸睛的首图标题元素以外,还是后面几页内容的根基。
我一度以为要用很长的篇幅给大模型描述,我要做个什么样的小红书图文排版,各种跟他解释我整个排版要怎样关联,怎样布局…
结果居然是这样简单,就告诉他,我要主标题副标题短标题,有什么字数要求,还要按照标题生成10个符合要求的实操技巧,就完事了。
至于排版的部分,是搭建好的画板来解决,如果布局不好看,比如字数超了导致换行、没对齐,再跟大模型进一步调整限制字数的要求。
在这里插入图片描述
然后就是生成各页面的大模型节点,负责来提取前面生成的、自己负责的这部分小贴士的主题,并且以此进一步生成画图的提示词。
我以为提取内容这部分少说需要写代码,然后中间再把需求描述给GPT让它代劳实现代码逻辑,没想到大模型直接就把提取内容整个活做了。
原视频UP也说,简单的内容提取可以交给大模型做,确认它完成得也很优秀,免得我把需求给另外的AI描述半天,然后测试代码等折腾了。只需要针对不同页的大模型,把提取哪几条小技巧(下图黄色高亮部分,比如第一页提取1-2条小技巧,第二页提取3-4条小技巧…)改一下即可。
这段提示词同时还做了生成给后面的图像生成节点构造提示词的任务,甚至都没有分段或者分点,行云流水一气呵成,但是效果非常到位,看来模型对提示词的理解能力非常好,没用遗漏或者误解这一段话的好几个需求,可以说是《高端的食材只需要最简单的烹饪方式》?
在这里插入图片描述
最后就是生成图片的指令,这个就相对普通平常了,为了不至于抠完图后主体物被切掉太多部分,所以让周围留出一些距离。在这里插入图片描述整个过程是调用了三层大模型,第一层总大模型负责围绕用户输入的主题,生成标题和10个小贴士作为大的框架,第二层是每一页的大模型,负责专注自己的那部分小贴士,补全细化文本内容,并且生成给图像模型的提示词,第三层每张图的图像生成模型负责按照输入指令生成图片。

简短总结:

整个工作流的结构,大模型、画图节点的调用方式,以及简明干练的提示词描述能力,很值得学习和借鉴,感谢原UP带来这么棒的教程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/84799.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何选择自动化编程平台

从事自动化行业的工作者都知道,做PLC编程需要PLC编程软件,做HMI可视化需要HMI编程软件,做SCADA需要SCADA编程软件,做DCS需要DCS软件,做仿真调试需要仿真软件。这些软件有国外的、国内的,有传统自动化厂商开…

Bug 背后的隐藏剧情

Bug 背后的隐藏剧情 flyfish 1. 「bug」:70多年前那只被拍进史书的飞蛾 故事原型:1947年哈佛实验室的「昆虫命案」 1947年的计算机长啥样?像一间教室那么大,塞满了几万根继电器(类似老式开关)&#xff…

如何将通话记录从Android传输到Android

“如何将通话记录从 Android 转移到 Android?我换了一部新的 Android 手机,想要将通话记录复制到其中。”您需要将通话记录从 Android 传输到 Android 是一种常见的情况,因为通话记录是手机上最重要的数据之一。幸运的是,如果您从…

Android 云手机横屏模式下真机键盘遮挡输入框问题处理

一、背景 打开横屏应用,点击云机EditText输入框,输入框被键盘遮挡,如下图: 未打开键盘状态: 点击第二个输入框,键盘遮挡了输入框: 二、解决方案(推荐第三中方案,博主采用的也是第三种方案) 博主这里整理了三种方案:…

进程IO之 进程

一、进程相关概念 1.什么是进程 程序:静态的,编译好的可执行文件,存放在磁盘中的指令和数据的集合 进程:动态的,是程序的一次执行过程,是独立的可调度的任务 2.进程的特点 (1)对…

Condition源码解读(二)

本章我们继续将Condition的最后一个方法signal方法,如果前面没有看过的可以点击LockSupport与Condition解析来看看Condition解读的前半部分。 signal方法: public final void signal() {if (!AbstractQueuedLongSynchronizer.this.isHeldExclusively())…

股票收益率的计算

首先,需要从 Tushare.pro 注册一个账号并调用其API获取股票日线数据(具体操作请查看官网)。 以通过调用tushare获取股票000001(平安银行)的股票数据为例,这里不设置日期,那么默认获取Tushare提供的所有历史数据。也可…

《算法笔记》13.2小节——专题扩展->树状数组(BIT) 问题 D: 数列-训练套题T10T3

数列(sequence.pas/c/cpp) - 问题描述 一个简单的数列问题&#xff1a;给定一个长度为n的数列&#xff0c;求这样的三个元素ai, aj, ak的个数&#xff0c;满足ai < aj > ak&#xff0c;且i < j < k。 - 输入数据 第一行是一个整数n(n < 50000)。 第二行n个整…

C# Windows Forms应用程序-001

目录 项目概述 主要组件及功能 类定义 控件声明 构造函数 Dispose 方法 InitializeComponents 方法 控件配置详解 Button 控件 (button1) TextBox 控件 (textBox1) GroupBox 控件 (groupBox1) Label 控件 (label1 至 label5) OpenFileDialog 控件 (openFileDialog1…

2025.5.28总结

今日工作&#xff1a;最近进入了项目的关键节点&#xff0c;要求每人每天提两单&#xff0c;今天周三&#xff0c;下班前只提了一个单。下午开了一场需求服务验收会&#xff0c;我演示了自己验收的那个需求&#xff0c;然后讲的不是很好。当初再构造数据时请教了一个人&#xf…

Transformer核心技术解析LCPO方法:精准控制推理长度的新突破

原创文章1FFN前馈网络与激活函数技术解析&#xff1a;Transformer模型中的关键模块2Transformer掩码技术全解析&#xff1a;分类、原理与应用场景3【大模型技术】Attention注意力机制详解一4Transformer模型中位置编码&#xff08;Positional Embedding&#xff09;技术全解析(…

在 WSL 中安装 JetBrains Toolbox:完整指南

JetBrains Toolbox 是一个非常实用的工具&#xff0c;它可以帮助开发者轻松管理 JetBrains 的各种开发工具&#xff0c;如 IntelliJ IDEA、PyCharm、WebStorm 等。通过它&#xff0c;你可以快速安装、更新和管理这些工具&#xff0c;极大地提高了开发效率。而在 WSL 环境中安装…

ZooKeeper 命令操作

文章目录 Zookeeper 数据模型Zookeeper 服务端常用命令Zookeeper 客户端常用命令 Zookeeper 数据模型 ZooKeeper 是一个树形目录服务,其数据模型和Unix的文件系统目录树很类似&#xff0c;拥有一个层次化结构。这里面的每一个节点都被称为&#xff1a; ZNode&#xff0c;每个节…

Turf.js:前端地理空间分析的瑞士军刀

在Web开发中,地理空间数据处理已成为许多应用的核心需求。从地图可视化到位置服务,再到复杂的数据分析,前端开发者需要强大的工具来处理这些任务。Turf.js 作为一款轻量级、模块化的地理空间分析库,凭借其丰富的功能和易用性,成为前端开发者的得力助手。本文将深入探讨 Tu…

大模型微调

使用 Ollama 微调大语言模型&#xff08;如 LLaMA、Mistral、Gemma 等&#xff09;主要是围绕 LoRA&#xff08;Low-Rank Adaptation&#xff09;或者 QLoRA 等轻量级微调技术进行的。Ollama 本身是一个部署和运行本地大语言模型的平台&#xff0c;但其微调能力有限&#xff0c…

《自动驾驶轨迹规划实战:Lattice Planner实现避障路径生成(附可运行Python代码)》—— 零基础实现基于离散优化的避障路径规划

《自动驾驶轨迹规划实战&#xff1a;Lattice Planner实现避障路径生成&#xff08;附可运行Python代码&#xff09;》 —— 零基础实现基于离散优化的避障路径规划 一、为什么Lattice Planner成为自动驾驶的核心算法&#xff1f; 在自动驾驶的路径规划领域&#xff0c;Lattice…

切换到旧提交,同时保证当前修改不丢失

在 Git 中&#xff0c;可以通过以下几种方式切换到之前的提交&#xff0c;同时保留当前的提交&#xff08;即不丢失工作进度&#xff09;&#xff1a; 1. 使用 git checkout 创建临时分离头指针&#xff08;推荐用于查看&#xff09; git checkout <commit-hash>这会让…

zookeeper 操作总结

zookeeper 中的节点类型 节点类型命令选项说明‌持久节点‌无选项&#xff08;默认&#xff09;永久存在&#xff0c;除非手动删除。‌临时节点‌-e与客户端会话绑定&#xff0c;会话结束自动删除&#xff08;‌不能有子节点‌&#xff09;。‌顺序节点‌-s节点名自动追加递增…

nova14 ultra,是如何防住80°C热水和10000KPa水压冲击的?

暴雨突袭&#xff0c;手忙脚乱护住背包&#xff0c;却担心手机被雨水浸湿&#xff1b;泳池里想记录美好时刻&#xff0c;却担心手机掉入水中 &#xff1b;厨房里充满了高温水汽&#xff0c;近距离拍摄美食瞬间&#xff0c;手机屏幕花屏&#xff0c;让人失去了对美食的兴趣…… …

flutter加载dll 报错问题

解决flutter加载dll 报错问题 LoadLibrary 报错 126 or 193 明确一点&#xff1a;flutter构建exe 时默认是MSVC的。 1. 先检查dll 的位数是否满足 file ***.dll output: PE32 executable (DLL) (console) x86-64, for MS Windows, 19 sections 这种是64位的机器。 满足的话可…