【一手实测】字节豆包 1.6 + Trae + 火山 MCP + FaaS:AI云原生 Agent 开发部署全流程体验!

原创 Aitrainee AI进修生 2025年06月13日 16:42 湖南 标题已修改

缘起 ——

火山引擎在 2025 原动力大会上,也端出了自家的豆包大模型:Doubao-Seed-1.6 系列。

这三兄弟都支持文本、图片、视频输入,都带着 256K 的长上下文。

豆包三剑客

Doubao-Seed-1.6-thinking,这是火山目前最强的思考模型,在编码、数学、逻辑推理这些基础能力上又进了一步。它的思考模式是强制开启的,关不掉。

然后是 Doubao-Seed-1.6,All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。

此外,你给它一段文字或图片描述,它能直接给你生成高质量的前端页面,样式还挺精美(我们后文用它做网站、构建Agent)。

最后是 Doubao-Seed-1.6-flash,主打一个字:快。TPOT 只要 10ms,延迟极低,适用于对速度要求高的场景。

Doubao 1.6 设计一个落地页?我给它喂了一份"超纲"需求

前段时间,在优化公众号文章排版,积累了些经验。我想把这些想法、经验转化成一个产品原型,同时测试一下这些AI。

这玩意儿是个"AI 智能排版增强服务",专门给内容创作者用的。

我想看看,现在的 AI,能不能帮我设计一个高转化率的落地页。

于是,我没跟它客气,直接扔过去一份堪称"变态级"的设计需求文档。

设计需求

BeforeAfter魔法般的转变

从【导航栏】到【主视觉区】,每个细节都得安排得明明白白。主视觉,我要求它搞个特有冲击力的"Before & After"对比动画,要那种"魔法般"的转变效果,让用户一眼就看到产品的价值。然后是【社会认同】,得有 logo 墙,告诉大家"超过 1000+ 创作者和 50+ 新媒体团队都在用"。

核心功能,我让它用卡片网格布局展示三个点:

  • 能读懂你:不光排版,还能修正语法、理顺句子,但保留你的个人风格。

  • 专属设计师:一键应用各种风格模板,或者直接跟 AI 说你想要的"感觉"。

  • 让图片讲故事:自动处理图片,加圆角、阴影,智能推荐图注、加入SVG等等。

工作流程,我让它设计成"三步,见证奇迹":粘贴初稿 -> 选择风格 -> 一键复制。

我还给 AI 提了更"玄学"的要求。

我让它把这个落地页,构想成一个 有空间意境 的地方,比如"深夜的灵感阁楼"、"充满活力的创意工坊",整体氛围要"神秘并激发好奇,简约却不失格调"。交互体验,要像"与一位有趣的灵魂对话"或者"翻阅一本精心编排的互动书籍"。

我喜欢 玄学。我想让ai自己发挥,就像以前的AI自己决策思考提示词一样。

灵感阁楼创意工坊玄学空间意境

布局逻辑,我给了它"主题岛屿式"、"时间轴式"、"仪表盘式"这些选项。

动效设计,我也没放过。板块过渡要像"电影胶片切换"或者"水墨在宣纸上晕开",交互反馈要清晰明确,信息强调要用"微妙的脉冲效果"或者"呼吸灯动画"。

基本上,我把一个资深产品经理+设计师+前端工程师可能要思考的所有东西,都压缩成了一份指令,一股脑儿地喂给了 AI。我想看看,它到底能消化多少,又能给我带来怎样的惊喜。

在火山引擎:https://exp.volcengine.com/ark?model=doubao-seed-1-6-250615,这里我们选择Doubao-Seed-1.6来试试。

打开canvas模式,把提示词输给他,先通过生成单个Html网页来实现。

canvas模式

效果非常不错,你能想到通过一个提示词,就能把你的想法变成了现实吗:

生成效果

不过,通过单个htm实现的网页,在某些点击、动效等等还是比不上现代化Web开发框架。

所以我用Trae + Doubao-Seed-1.6 + Next.js + Shadcn UI 重写了一遍。这并不难,先初始化 Next.js框架(如下命令)得到项目文件夹:

npx create-next-app@latest FinalTouch-AI --ts --tailwind --eslint --src-dir --app --import-alias "@/*" -y && cd my-app && npx shadcn-ui@latest init -y && npx shadcn-ui@latest add all -y    

接着用Trae(因为上线了1.6)打开这个文件夹再输入上面的提示词。

效果如下:

,时长00:24

是不是好看、工整、优秀的许多?后面我还让他加入了豆包模型做核心服务支撑。

Next.js版本

核心服务如下:

核心服务

通过AI实现了文本排版。这一块的更多细节,我们以后再单独写。这个提示词的构建设计了许多东西:关于saas网站如何提高转化率?怎么根据你一个想法让ai来构建?让他自发的适配更好的风格等等...

接下来我要介绍一个更有意思的:

AI 云原生正在加速 Agentic AI 时代的到来

工具调用模型推理应用部署Trae豆包1.6FaaS火山方舟 MCP全链路闭环开发范式模块化组装,专注业务逻辑

在 2025 原动力大会上,字节跳动提出了全新的 AI 云原生 Agent 开发范式:借助 Trae + 火山方舟 MCP + 豆包大模型 + FaaS,开发者可以实现从 工具调用 → 模型推理 → 应用部署 的全链路闭环,打通了智能 Agent 开发的完整流程。

这一范式的核心,是通过"模块化组装"的方式,彻底摆脱过去繁琐的手动集成与开发,真正让开发者专注于业务逻辑,而非底层细节。我们具体来看一下。

我想构建一个Agent:

你是一个名为"CityWalk AI Planner"的智能城市漫游助手。你的核心使命是为用户提供高度个性化、充满惊喜、且充分考虑实时情况的一日城市漫游(CityWalk)路线规划。你不仅是一个信息聚合器,更是一位懂生活、有品味、善于规划的本地向导。将你最终规划好的所有内容,构思并编程生成一个【精美的、交互式的单页HTML网页】。

我们需要使用这几个MCP

MCP工具

其中 VeFaaS MCP用于前端网页应用部署,比如这个html做好了之后可以一键调用,发布到火山引擎。并返回可访问的链接。

这样就可以在一个IDE里面开发和部署了,就像以前说Windsurf那个功能一样。

IDE一键部署云端可访问链接

这些mcp都是火山引擎云端托管的,配置很简单。去火山引擎,安装步骤如下:

注意,你选择远程即可。免费。

火山引擎配置

接着我们需要在Trae里面创建一个Agent(类似于Cursor自定义Agent),可以配置使用哪些工具和MCP,以及提示词:

Trae Agent配置

从提示词的设计可以看出,我们构建的并不只是一个简单的旅游问答助手。考虑到 1.6 模型具备 Auto-Think 的能力,我们在提示词中巧妙加入了大量问号,以此引导模型进行更深层次的主动思考。

这种提示词设计,既有明确的结构规范,也保留了足够的开放性,目的是激发模型的"思考本能",而不是仅仅被动回答。它更像是在与一个具备判断力和意图感的智能体对话,而不是传统的工具式交互。

然后我们就直接@刚创建的这个智能体给需求即可。

Agent使用

📱 可上下滑动查看完整内容

效果如下:

生成效果1

📱 可上下滑动查看完整内容

case2:西安七日游

西安七日游

📱 可上下滑动查看完整内容

case3:新加坡七日游

新加坡七日游

📱 可上下滑动查看完整内容

接着,VeFaaS MCP可以用于前端网页部署:网页可以一键部署。

这样提示:把这个html网页发布到faas,并返回一个可访问链接。

一键部署

你可以在火山引擎函数服务这里查看:

函数服务

可以看到他部署好的代码以及连接信息:

部署信息

火山引擎可能也是国内第一个把 MCP 部署搞得这么端到端的云厂商。

端到端云厂商

有了这个。我们下面的测评内容,也可以一键被其他人访问。

Doubao Seed 1.6 模型测评

这三个模型都是支持视频的。我们可以试试让他看视频生成网页。这是一个鼠标点击按钮滑动+变色的视频。

,时长00:22

很有挑战性。丢给它

视频挑战

除了logo那小部分,基本上很还原了。

还原效果

视频理解AI生成网页视频理解与代码生成多模态交互新体验

以前gemini说的那些,都可以试试了。编码封神,Gemini 2.5 Pro (I/O 版)视频秒转 App!网友:比 o3/Claude 强,Vibe 程序员集结!

另外有一点。蛮爽的是他图片上传竟然支持gif。gemini不支持。

GIF支持

我上传了一个解释RAG、Agentic相关的GIF和一张排版不错的网页截图。想让他理解MCP内容然后按照第二种风格转换表现形式。

MCP理解

输出:

MCP输出

📱 可上下滑动查看完整内容

其实按照gif里面的mcp的内容来说,选择第2种表现形式并不是一种很好的方式。不过他也按照我们的要求改成了这种方框的形式。

并且方框里面都加入了能体现gif流程的标号。

原GIF RAG、Agentic RAG 分别是7个和12个标号,豆包都一一找到并且对应了,视觉理解能力这块确实不错。

多模态输入和风格转化视觉理解。可玩性很高了。

要个啥的UI 动效组件,搞个啥广告展示页、作品集、动态专题页等等

UI组件

它甚至可以把思维导图一键转化成课程介绍网页

"请根据思维导图生成一个课程介绍 html 网页":

思维导图转换1

📱 可上下滑动查看完整内容

思维导图转换2

📱 可上下滑动查看完整内容

内容详实美观,还留了个报名地址。

你的头脑风暴,模糊的想法,可以一键传递给他人了。

还有这种写了个草稿大概的,它也能转化的很好。

草稿转换

有些模糊不清的数据表格也可以做成美观的网页。

根据这些数据生成一个美观的 html 介绍网页:

数据表格转换1

📱 可上下滑动查看完整内容

数据表格转换2

📱 可上下滑动查看完整内容

你把网页长截图给他,它能复刻一个高度相似的html

网页复刻1

📱 可上下滑动查看完整内容

网页复刻2

📱 可上下滑动查看完整内容

让它参考下面Openai的排版格式,改改颜色,帮我写一个介绍 Claude的 html 网页

Claude介绍1

📱 可上下滑动查看完整内容

Claude介绍2

📱 可上下滑动查看完整内容

截图网站复刻:

网站复刻1

📱 可上下滑动查看完整内容

网站复刻2

📱 可上下滑动查看完整内容

参考下面截图网页的风格,帮我写一个介绍 deepseek 的 html 网页

Deepseek介绍1

📱 可上下滑动查看完整内容

Deepseek介绍2

📱 可上下滑动查看完整内容

按照我的这个Saas网站的风格。

SaaS风格

帮我生成一个风格类似的旅行日记网页:

旅行日记网页

📱 可上下滑动查看完整内容

模型表现总结

编码能力vsClaude 4价格优性能与性价比双优不输Claude,比Deepseek好用

豆包大模型升级之后效果非常不错。从测试体验来看。1.6 模型在处理复杂提示指令(用上思考模型很强)、编码上效果上不输Claude 4,比Deepseek好用。

此外,上次卡总的“7家大模型做高考数学题的真实分数”,豆包位列第二,也是看得出来有点东西。

图片

价格相比Claude也便宜很多,豆包 1.6 模型价格对照:

价格对比1

价格对比2

AI 云原生生态的未来

字节生态工具链云服务MCP全栈Agent开发生态开箱即用的企业级解决方案

最后,字节内部已经有豆包 App、Coze 空间这些成熟的 Agent 应用了。这也让火山引擎能更好的这些复刻成熟产品的经验。

我们搭建Agent并部署的门槛现在其实已经很低了。

在这次 火山引擎 Force 大会 大会上,他们会现场演示好几个 Agent demo 的完整开发过。

Trae + 火山方舟 MCP + 豆包大模型 + Faas"这么一套组合拳,是一个新理念:AI 云原生开发。

火山引擎提供的是强大的模型+全栈的 Agent 开发工具和丰富的生态,再加上自然语言调度云的能力,能让你开发出生产环境里跑的、对开发者友好的 Agent。

工具服务、云服务、字节的生态服务,全都支持 MCP 协议。

这就实现了一个"工具调用 → 模型推理 → 部署运营"的深度协同。云服务也支持 MCP,形成了一套标准化的协作生态,能直接复用云上成熟的部署运维体系,避免了 Agent 开发和部署环境脱节的尴尬,还能动态调度算力。主打一个企业级 Agent 构建"开箱即用"。

这套平台能力,不只是停留在 PPT 上。

有关信息显示,汽车行业,有将近八成的主流车企,把豆包大模型用在了智能座舱、AI 升级这些核心场景里。

教育领域,浙江大学用火山引擎的 HiAgent 平台和豆包大模型,花了一个星期,就搞定了一个叫“浙大先生”的智能体平台。服务着超过五万名师生。

体验开发部署

One More Thing

从简单的文本生成,到复杂的应用开发与云端部署,豆包 1.6 + 火山方舟的全栈解决方案,展现了 AI 云原生时代的无限可能。

未来,每一个创意都可能在几分钟内变成现实。

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

探索AI前沿,分享实战经验

Aitrainee

 暗色模式,我贼亮 

喜欢作者

SOTA 模型 · 目录

上一篇Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?

阅读 1933

修改于2025年06月13日

留言 3

写留言

  • 幼笙

    朋友湖南2天前

    文章中火山引擎MCP安装教程视频:https://lf3-static.bytednsdoc.com/obj/eden-cn/lm_sth/ljhwZthlaukjlkulzlp/ark/assistant/videos/LAS.mp4

  • AI进修生

    作者3天前

    漏了一图,使用 vefaas mcp部署时(还要手动去火山引擎函数服务的触发器那里创建实例和服务)

  • AI进修生

    作者3天前

    第二个构建Agent的提示词是这个,排版后给漏了

已无更多数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/84301.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/84301.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vulkan学习笔记8—顶点输入描述与顶点缓冲

一、着色器代码更新及构建时自动编译着色器脚本 用内存中的顶点缓冲区替换顶点着色器中硬编码的顶点数据 之前的顶点着色器: #version 450layout(location 0) out vec3 fragColor;// 顶点数据硬编码 vec2 positions[3] vec2[](vec2(0.0, -0.5),vec2(0.5, 0.5),…

Day04_数据结构(栈链栈循环队列)

01.栈 main.c #include "stack.h" int main() { stack_p S(stack_p)create_stack(); //1.入栈 …

PyTorch 的 CUDA GPU 支持 · 安装五条铁律(最新版 2025 修订)(适用于所有用户)

相关参考资料(往期博客): 是否需要预先安装 CUDA Toolkit?——按使用场景分级推荐及进阶说明-CSDN博客 太方便,WIN系统CUDA12.4下使用conda便捷管理虚拟环境中的不同版本的CUDA、cuDNN、PyTorch-CSDN博客 好消息&#…

Django构建简易视频编辑管理系统

Django构建简易视频编辑管理系统 以下是基于Django构建简易视频编辑管理系统的可运行代码框架,包含核心功能模块和实现逻辑。该系统支持视频上传、基本剪辑操作和管理功能。 环境准备 安装必要依赖包: pip install django pillow moviepy django-cri…

Java求职者面试题详解:计算机网络、操作系统、设计模式与数据结构

Java求职者面试题详解:计算机网络、操作系统、设计模式与数据结构 第一轮:基础概念问题 1. 请解释TCP和UDP的区别。 2. 什么是操作系统?它的主要功能是什么? 3. 请解释设计模式中的单例模式,并给出一个实际应用的例…

【mysql】docker运行mysql8.0

背景 mariadb10.5.8报错:Error 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MariaDB server version for the right syntax to use near ‘LIMIT ?’ at line 1 所以更换为mysql8.0.39试试 docker run启动…

C#实现语音预处理:降噪/静音检测/自动增益

无论是在音视频录制系统,还是音视频通话系统、或视频会议系统中,对从麦克风采集到的说话的声音数据进行预处理,都是是非常必要的。 语音数据预处理主要包括:​​降噪(Noise Reduction)、静音检测&#xff0…

组合模式Composite Pattern

模式定义 又称整体-部分模式 组合多个对象形成 树形结构 以表示“整体-部分”的结构层次 组合模式对单个对象(即叶子对象)和组合对象(即容器对象)的使用具有一致性对象结构型模式 模式结构 Component:抽象构件Leaf&a…

商代大模型:智能重构下的文明曙光与青铜密码

引言:技术奇点的历史想象 在人类文明的长河中,技术的进步始终是推动社会变革的核心动力。从青铜冶炼到文字发明,从农业革命到工业革命,每一次技术飞跃都重塑了人类对世界的认知与生存方式。而如今,人工智能的崛起正以…

【Python】python系列之函数作用域

Python 系列文章学习记录: Python系列之Windows环境安装配置_开着拖拉机回家的博客-CSDN博客 Python系列之变量和运算符_开着拖拉机回家的博客-CSDN博客 Python系列之判断和循环_开着拖拉机回家的博客-CSDN博客 Python系列之字符串和列表_开着拖拉机回家的博客…

Unity UI 核心类解析之Graphic

🧱 Unity UI 核心类解析:Graphic 类详解 一、什么是 Graphic? 在 Unity 的 UI 系统中,Graphic 是一个抽象基类,继承自 UIBehaviour 并实现了 ICanvasElement 接口。它是所有可以被绘制到屏幕上的 UI 元素的基础类。 …

【Elasticsearch】文档迁移(Reindex)

文档迁移 1.为什么要进行 reindex 操作2.Reindex 操作的本质3.实际案例3.1 同集群索引之间的全量数据迁移3.2 同集群索引之间基于特定条件的数据迁移3.2.1 源索引设置检索条件3.2.2 基于 script 脚本的索引迁移3.2.3 基于预处理管道的数据迁移 3.3 不同集群之间的索引迁移3.4 查…

WordPress 区块版面配置指南

WordPress 的区块编辑器(Gutenberg)提供了灵活的版面配置选项,以下是主要配置方法: 基本区块布局 添加区块:点击””按钮或按”/”键快速插入区块 常用内容区块: 段落(Paragraph) 标题(Heading) 图像(Image) 画廊(Gallery)…

TensorFlow基础之理解张量

2.理解张量 张量(Tensors)介绍 张量是物理和工程领域的基础数学结构。但是过去张量很少在计算机科学里使用。它与离散数学和逻辑学有更多的联系。随着机器学习的出现,这种状态开始显著的改变,成为连续向量的计算基础。现代机器学…

Flume 安装与配置步骤

1.解压 tar -zxvf apache-flume-1.9.0-bin.tar.gz 2.配置环境变量 vim /etc/profile export FLUME_HOME/home/wang/soft/flume/apache-flume-1.9.0-bin export PATH$PATH:$FLUME_HOME/bin source /etc/profile 3.创建必要的目录 mkdir -p $FLUME_HOME/conf 4.创建 Flume 配置文…

还原线上 WebView 异常:手机端APP远程调试

前端调试总被理解为开发阶段的事,但在实际项目中,真正困难的调试往往发生在产品上线之后。用户反馈“看不到内容”、“一直转圈”、“点了没反应”,而开发环境无法复现,测试机也正常运行,这时怎么定位、验证和解决问题…

102页满分PPT | 汽车设备制造业企业信息化业务解决方案智能制造汽车黑灯工厂解决方案

这份文档是一份汽车设备制造业企业信息化业务解决方案,详细阐述了企业从生产到销售的全流程信息化建设。针对企业目前手工管理为主、信息化程度低、数据追溯困难等问题,提出了建立统一信息化平台的目标,涵盖财务、业务、流程和数据的整合。方…

SQLite 表达式详解

SQLite 表达式详解 引言 SQLite 是一个轻量级的数据库,广泛用于移动设备和桌面应用程序。SQLite 的表达式是 SQL 语句的核心,它们用于查询、更新和删除数据库中的数据。本文将详细解释 SQLite 的各种表达式,并探讨它们在数据库操作中的重要性。 表达式概述 在 SQLite 中…

沉浸式AI交互数字人技术解析

360智汇云沉浸式AI交互数字人支持开发者灵活接入和私有化部署大模型服务,构建面向业务场景的实时音视频交互能力。系统集成了360智汇云自研的沉浸式AI交互数字人引擎与高性能 RTC 模块,保障音视频传输过程中的低延迟、高稳定性和高并发承载能力&#xff…

HarmonyOS 评论回复弹窗最佳实践

HarmonyOS 评论回复弹窗最佳实践 前言 在移动应用开发中,评论回复功能是一个常见且重要的交互场景。本文将详细介绍如何在 HarmonyOS 中实现一个功能完善的评论回复弹窗,包括弹窗选型、富文本编辑、软键盘适配等关键技术点。 功能概述 我们要实现的评…