华为云Flexus+DeepSeek征文|实战体验云服务器单机部署和CCE高可用的架构AI赋能

 

前引:“在数字化浪潮汹涌澎湃的今天,企业对云计算服务的需求已从基础架构支撑,逐步转向更深层次的AI赋能与业务创新驱动。面对复杂多变的市场环境,选择一个强大、可靠且具备前瞻性的云服务伙伴,无疑是企业实现高速增长的关键。作为全球领先的ICT基础设施和智能终端提供商,华为在云计算领域同样深耕多年,其华为云平台凭借深厚的技术积累和独特的生态优势,正日益成为众多企业数字化转型的首选。本文将带您深入探索华为云的各项服务,从核心技术、AI能力到实际应用场景,全面测评华为云在助力企业构建智能化未来方面的真实表现~

目录

DeepSeek R1/V3商用服务开通

商用服务开通体验

云服务单机部署

CCE高可用部署

Dify-LLM的登录

MaaS服务对接

搭建自己的AI工作流

搭建Agent

搭建知识库问答助手

算力、效率体验

建议

心得分享


DeepSeek R1/V3商用服务开通

(1)新人需要先进行认证、登录

(2)选择ModelArts Studio控制台

(3)选择在线推理,选自己喜欢的模型开通体验即可

商用服务开通体验

一进入界面,就可以看见ModelArts Studio控制台,画面既简洁又有技术感,例如:

整个开通过程简单的三步就可以完成,DeepSeek R1/V3的体验也很强,包括贴心赠送的免费额度,这不用用户一上来就需要付费,可以先选择体验,给用户的感受很好,点赞!

云服务单机部署

(1)首先我们需要在ModelArts Studio控制台完成授权,保证单机部署成功

(2)选择华为云单机部署

(3)我们可以直接用默认配置,选择下一步

(4)这里只需要注意密码的格式正确即可,加密、版本都可以自由选择,再选择下一步

(5)回滚是建议开启的,很大的提高效率;删除保护自定义即可,我们点击下一步

(6)确认配置没问题之后,就可以选择创建执行计划了

(7)等它创建成功,就点击开始部署

(8)确认执行

(9)从执行计划开始,整个过程大概10分钟左右,还是很快的

(10)等他部署完成,这样我们就完成了云服务器的单机部署

CCE高可用部署

高可用的部署比较云服务器单机部署更加的复杂一些,如果没有仔细阅读文档部署指南,失误多次是很正常的,包括CCE集群的一直报错,这可能是没有委托、授权等原因造成,下面开始教程~

(1)选择高可用部署,打开

(2)这个默认配置我们可以不管,直接点击下一步

(3)这里的任何密码都需要严格按照规定设置,否则很容易部署失败

(4)现在我们看到这个页面的下面,有三个需要特别特别注意,它们一般就是部署失败的原因,下面我们会分别获取这三个变量,请注意教程,避免填错!

首先我们来看桶名称的获取:

(1)在控制台直接搜索:桶,找到桶列表,点击创建

(2)配置的话我推荐低频的,这样计费可以减少一些,再点击下一步

(3)这样我们就创建完成了,这个桶的名字复制粘贴即可

秘钥ID、秘钥的获取:

(1)在控制台搜索:我的凭证

(2)这里还是建议重新设置一个秘钥:点击创建秘钥,会生成一个小文档,下载下来

(3)然后打开下载的那个文档,我就得到了秘钥、秘钥ID,复制粘贴即可

上面我们就分别获取了桶名称、秘钥、秘钥ID,分别复制粘贴在对应的配置栏即可

(5)配置栏配置好之后,我们可以看见这里有个委托,这是必须设置的

委托的获取与授权:

(1)点击创建委托

(2)搜索:rf_admin_trust,如果没有就点击创建

(3)委托名字设置为:rf_admin_trust,点击云服务、RFS,这是最重要的一步,然后完成

(4)点击立刻授权,配置权限

(5)搜索下面这个权限,进行添加

(6)选择所有资源,然后确定就完成了创建

(7)打开云容器引擎CCE,授权委托,这个过程大概需要等15分钟左右缓存才有效果

授权之后等15分钟缓冲,再继续开始配置部署!

(6)点击创建执行计划

(7)完成配置确认

(8)待创建成功之后,开始部署

(9)这个过程大概18分钟或者20分钟左右,需要耐心等待,待部署成功就可以了

Dify-LLM的登录

不管是高可用部署还是云服务单机部署,我们在部署成功之后都会生成一个IP地址,例如下面这样,我们复制IP在浏览器打开,这里以CCE高可用的部署成功为基础,复制IP打开!

(1)设置邮箱密码

(2)重新输入邮箱密码

(3)进入到这个页面就完成了,下面我们开始配置AI

MaaS服务对接

因为我们在后面搭建AI时,都要以DeepSeek等模型作为基础,否则后面没有模型可以使用

 (1)点击设置

(2)供应商找到这个模型,添加

(3)下面我们分别获取这三个变量

首先是名称、地址:

(1)打开ModelArts Studio,选择在线推理然后点击模型调用说明(需要使用开通的模型)

(2)打开右边的OpenAI ,这两个就是地址名称,粘贴复制在配置栏

接下来是秘钥的获取:

(1)打开ModelArts Studio控制台,选择下面的API管理

(2)点击创建秘钥

(3)创建成功之后,秘钥只会显示一次,注意复制粘贴一次性

 上面我们已经获取完了秘钥、秘钥地址、名称,下面我们回到配置

(4)完成配置

(5)下面这样就表示对接完成了

搭建自己的AI工作流

(1)在工作室选择导入DSL文件

(2)复制下面的USL到对话框,然后创建

https://documentation-samples.obs.cn-north-4.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-moudle/building-a-dify-llm-application-development-platform/workflow/DeepSeek_searXNG%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2_%E7%9F%A5%E8%AF%86%E5%BA%93.yml

(3)找到知识检索,然后右边点击“+”

(4)这个文档是个性的,可以插入学生信息、历史问题、社会安全等各种文档

(5)导入文档之后,就像下面这样就可以了

(6)再在工作流找到“搜索”,这里需要复制下面的URL,注意是高可用还是单机部署,注意区分

选择联网搜索插件,单击授权按钮,并添加URL。单机版部署填写Dify服务器私网IP:http://{ECS私网IP}:8080;高可用部署填写URL:http://searxng:8080。如下图所示,单击“保存”后,即可设置成功。(ECS私网IP是部署Dify的虚机的内网ip,如连接不通,请检查虚机的安全组是否放通8080端口号)

(7)接下来在整个工作流找这种带黄色感叹号的,这表示是要切换模型的,比如下面这个:

重新在整个工作流查找这种黄色感叹号的,都需要切换模型,和上面操作相同

(8)处理完之后点击发布

(9)点击运行,接下来在工作室就可以看到自己的工作流了

搭建Agent

(1)点击创建空白应用

(2)选择Agent,设置名字,点击下一步

(3)点击生成提示词并且应用

(4)配置自己喜欢的参数,没问题之后在发布,运行即可(记住先更新)

(5)这样我们就可以在工作室开始正常使用了

搭建知识库问答助手

(1)在知识库选择创建

(2)添加个性化文档,点击下一步即可

(3)点击查看文档是否添加成功、可用

(4) 显示“可用”,就代表搭建完成了,这样在后面配置AI的时候,就可以使用这个文档了,相当于给AI插入指定信息,它可以在这里面搜索内容

算力、效率体验

在本次华为云CCE容器引擎部署Dify-LLM的体验中,最直观的感受是​​弹性算力资源带来的高效与成本平衡​​。通过一键部署功能,单机版仅需10分钟即可完成环境搭建,且资源按需计费(如Flexus云服务器X实例0.95元/小时),适合个人开发者低成本体验。而高可用版通过CCE集群自动扩缩容能力,实现了资源动态分配——在模型推理高峰时段,CCE集群自动扩容节点保障响应速度,低峰时缩减资源,综合成本控制在35~70元/小时,相比传统自建IDC节省约60%运维投入,部署时间大概20分钟左右,对比传统的,还是快很多的。下面我们来看它对比单机部署体现出来的优势:

​​稳定性​​:CCE集群的多节点负载均衡避免了单点故障,实测QPS(每秒查询率)提升40%;

​​扩展性​​:通过Redis缓存和CSS向量数据库的集成,复杂AI Agent的并发处理能力提升2.3倍;

​​智能调度​​:NAT网关与弹性公网IP的联动,使跨国API调用延迟降低至80ms以内,远优于常规云服务

建议

​​成本优化建议​​:针对高频推理场景,建议提供“阶梯式预留实例”选项,例如承诺月均资源用量可享额外折扣,进一步降低企业成本;

文档细节补充​​:部署指南中CCE集群日志排查部分稍显简略,可增加常见错误代码(如EIP绑定超时)的解决方案示意图;

社区互动增强​​:希望开设“方案对比实验室”专栏,鼓励用户上传不同配置的性能测试报告,促进技术经验共享

心得分享

此次体验充分感受到华为云“用AI解放生产力”的理念——从弹性算力调度到分钟级部署,既降低了大模型应用的入门门槛,又通过CCE容器引擎保障了企业级稳定性。作为开发者,我看到了一个费用低、技术高、稳定的部署体验,期待未来能看到更多类似“一键迁移传统模型到Dify”的进阶功能,持续降低AI落地的技术摩擦!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/83606.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

雷卯针对易百纳G610Q-IPC-38E 模组防雷防静电方案

一、应用场景 1、智能监控 2、智能家居 3、工业自动化 4、机器人 5、智能交通 6、医疗影像 7、教育科研 二、 功能概述 1 HI3516CV610(ARM Cortex-A7 MP2) 2 AI算力 1Tops 3 模组集成 4M30FPS Sensor,支持最高 6M30fps 的 ISP 图像…

生成对抗网络(GAN)基础原理深度解析:从直观理解到形式化表达

摘要 本文详细解析 生成对抗网络(GAN) 的 核心原理,从通俗类比入手,结合印假钞与警察博弈的案例阐述生成器 与 判别器 的对抗机制;通过模型结构示意图,解析 噪声采样、样本生成 及判别流程;基于…

OptiStruct结构分析与工程应用:无限元法介绍

13.3 无限元方法 本节将详细阐述如何利用无限元方法求解外声场分析,具体包括无限元方法基本理论,无限单元介绍、无限元分析建模指南及检查,最后以一个实例讲解整个分析设置过程。 13.3.1 无限元分析基础理论 无限元求解外声场的基本原理如…

判断:有那种使用了局部变量的递归过程在转换成非递归过程时才必须使用栈

这道题的关键在于理解递归转非递归与 “是否用栈” 的本质逻辑,和 “局部变量” 无关,核心看递归的调用上下文是否需要保存。 一、递归的本质:依赖 “调用栈” 递归函数执行时,系统会用调用栈保存: 每层递归的参数、…

leetcode1443. 收集树上所有苹果的最少时间-medium

1 题目:收集树上所有苹果的最少时间 官方标定难度:中 给你一棵有 n 个节点的无向树,节点编号为 0 到 n-1 ,它们中有一些节点有苹果。通过树上的一条边,需要花费 1 秒钟。你从 节点 0 出发,请你返回最少需…

MySQL 索引底层原理剖析:B+ 树结构、索引创建维护与性能优化策略全解读

引言 在 MySQL 数据库的世界里,索引是提升查询性能的关键利器。然而,很多开发者虽然知道索引的重要性,但对于索引背后的底层原理却知之甚少。本文将深入 MySQL 索引的底层实现,剖析 B 树的结构特点,以及如何利用这些知…

【Delphi】实现在多显示器时指定程序运行在某个显示器上

在多显示器时代,经常会出现期望将程序运行在某个指定的显示器上,特别是在调试程序的时候,期望切换分辨率,单步调试时,此时容易导致互相卡住,非常不方便,但是通过指定程序运行在不同的显示器上就…

不动产登记区块链系统(Vue3 + Go + Gin + Hyperledger Fabric)

好久没有介绍过新项目的制作了,之前做的一直都是Fisco Bcos的项目,没有介绍过Hyperledger Fabric的项目,这次来给大家分享下。 系统概述 不动产登记与交易平台是一个基于Hyperledger Fabric的综合性管理系统,旨在实现不动产登记…

论文阅读笔记——Large Language Models Are Zero-Shot Fuzzers

TitanFuzz 论文 深度学习库(TensorFlow 和 Pytorch)中的 bug 对下游任务系统是重要的,保障安全性和有效性。在深度学习(DL)库的模糊测试领域,直接生成满足输入语言(例如 Python )语法/语义和张量计算的DL A…

cocos3.X的oops框架oops-plugin-excel-to-json改进兼容多表单导出功能

在使用oops框架的过程中,它的导出数据并生成数据结构的插件oops-plugin-excel-to-json有些小的坑点,为满足我个人习惯,对此部分进行了一个小的修改,有需要的拿去用,记录下供大家参考; 一、配置:…

解决IDE编译JAVA项目时出现的OOM异常问题

出现的异常如图: java.lang.0utOfMemoryError:Java heap space 解决方案: 文件 --> 设置 搜索 编译器(就点击编译器这行),找到构建进程,共享堆大小,设置大一些,例如 2048 MB。 …

【Linux内核】设备模型之udev技术详解

目录 1. udev技术概述 2. 技术层次分析 2.1 内核层交互 2.2 规则引擎层 2.3 用户空间实现 3. 关键技术要点 3.1 动态设备节点管理 3.2 热插拔处理 3.3 模块化规则系统 3.3.1. 变量替换功能 3.3.2. 条件判断能力 3.3.3. 实现机制 3.3.4 应用场景 3.3.5 扩展能力 4…

群论在现代密码学中的应用探索与实践 —— 从理论到C语言实现

1. 引言:数字时代的信息安全挑战 随着互联网和数字技术的快速发展,信息安全问题变得日益严峻。无论是个人隐私保护,还是企业数据安全,乃至国家安全,都依赖于有效的加密技术保障信息的机密性和完整性。网络攻击、数据泄…

前端开发处理‘流式数据’与‘非流式数据’,在接收完整与非完整性数据时应该如何渲染和使用

在前端开发中,处理 非流式数据 和 流式数据 的方式不同。根据是否完整接收数据、是否实时渲染的需求,可以分为以下四种典型场景: 一、四类常见场景总结 类型数据完整性是否实时渲染适用技术/方法A完整数据(一次性返回&#xff09…

thymeleaf直接调用Spring Bean中定义的方法

thymeleaf中可以使用表达式工具对象&#xff0c;通过符号直接调Spring Bean中定义的方法 Spring Bean Component public class InvokeMethodBean {public String fun() { return "fun";} }thymeleaf中调用 <div th:text"${invokeMethodBean.fun()}"&…

虚拟斯德哥尔摩症候群:用户为何为缺陷AI辩护?

当韩国用户美咲连续第七次为虚拟男友的算法错误辩解&#xff1a;“他只是太累了才会说伤人的话”&#xff0c;心理医生在诊断书上写下“数字依赖伴随认知失调”。这种现象并非孤例——斯坦福2024年研究显示&#xff0c;62%长期使用情感AI的用户会主动为系统缺陷寻找合理化解释&…

tryhackme——Abusing Windows Internals(进程注入)

文章目录 一、Abusing Processes二、进程镂空三、线程劫持四、DLL注入五、Memory Execution Alternatives 一、Abusing Processes 操作系统上运行的应用程序可以包含一个或多个进程&#xff0c;进程表示正在执行的程序。进程包含许多其他子组件&#xff0c;并且直接与内存或虚…

[蓝桥杯]密码脱落

密码脱落 题目描述 X 星球的考古学家发现了一批古代留下来的密码。 这些密码是由 A、B、C、D 四种植物的种子串成的序列。 仔细分析发现&#xff0c;这些密码串当初应该是前后对称的&#xff08;也就是我们说的镜像串&#xff09;。 由于年代久远&#xff0c;其中许多种子…

Python绘图库及图像类型

折线图&#xff08;plot&#xff09; 绘图库介绍 Python中绘制折线图的全面指南_python绘制折线图-CSDN博客https://blog.csdn.net/2301_81064905/article/details/139689644 核心作用说明趋势分析揭示数据随时间推移的上升/下降趋势、周期性波动或转折点变化对比在单一图表…

4种常见Python设计爱心创意实现方法

在Python中设计爱心创意有多种实现方式&#xff0c;以下介绍4种常见方法&#xff0c;并附上完整代码&#xff1a; 方法1&#xff1a;使用数学方程绘制&#xff08;Matplotlib&#xff09; ​​原理​​&#xff1a;使用参数方程绘制心形曲线 ​​效果​​&#xff1a;光滑的数…