华为云 Flexus+DeepSeek 征文|华为云Dify 平台 CCE 高可用集群部署与大模型高质量知识库构建指南

华为云 Flexus+DeepSeek 征文|华为云Dify 平台 CCE 高可用集群部署与大模型高质量知识库构建指南

文章目录

    • 华为云 Flexus+DeepSeek 征文|华为云Dify 平台 CCE 高可用集群部署与大模型高质量知识库构建指南
      • 前言
        • 1、ModelArts Studio大模型开通
        • 2、Dify平台CCE高可用集群部署
          • 2.1 创建rf_admin_trust委托
          • 2.2 获取OBS桶名
          • 2.3 获取AK、SK密钥
          • 2.4 CCE集群高可用部署
        • 3、Dify平台模型供应商配置
        • 4、高质量知识库配置Embedding及Rerank模型
          • 4.1 部署Embedding及Rerank模型
          • 4.2 高质量知识库模型供应商配置
            • 4.2.1 ECS公网IP获取
            • 4.2.2 Ollama模型安装
            • 4.2.3 Xorbits Inference模型安装
      • 资源删除销毁
      • 华为云CCE高可用集群部署Dify平台
      • 总结

前言

本文聚焦华为云 Flexus 与 DeepSeek 深度整合场景,为开发者提供从 ModelArts Studio 大模型服务开通、CCE 高可用集群自动化部署 Dify 平台,到 Embedding 与 Rerank 模型部署及高质量知识库构建的全流程实战指南。通过华为云容器服务多节点冗余架构、弹性扩缩容能力与 Dify 微服务架构的结合,详解如何高效构建兼具高可用性、弹性扩展与安全合规的大模型应用开发环境,助力企业快速落地智能问答、知识管理等 AI 场景应用。

1、ModelArts Studio大模型开通

1、领取开通在线推理提供服务,点击ModelArts Studio控制台

在这里插入图片描述

2、点击模型推理-在线推理

在这里插入图片描述

3、开通商用服务或者免费服务都可以,如果是体验使用可以暂时使用免费服务,等到有更高的需求可以使用商用服务,另外说明商用服务是按Token计费

  • 免费服务开通:仅适合用于体验模型,且受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容

在这里插入图片描述

  • 商用服务:将为您提供商用级别的推理API服务,开放后您可以获取付费API服务

在这里插入图片描述

2、Dify平台CCE高可用集群部署

个人建议官方文档搭配博主的流程一起看,因为官方文档有的地方可能不是那么详细

  • 创建rf_admin_trust委托和创建OBS桶名:官方文档
  • 获取访问密钥AK/SK:官方文档
2.1 创建rf_admin_trust委托

1、统一身份认证-委托-创建委托-创建rf_admin_trust委托

在这里插入图片描述

2、创建委托

  • 委托名称:rf_admin_trust

  • 委托类型:云服务

  • 云服务:选择RFS

在这里插入图片描述

3、立即授权

在这里插入图片描述

4、搜索框中输入"Tenant Administrator"并勾选搜索结果,单击"下一步"

在这里插入图片描述

5、选择所有资源,并单击确定完成配置

在这里插入图片描述

在这里插入图片描述

6、委托列表中出现rf_admin_trust委托则创建成功

在这里插入图片描述

7、在云容器引擎CCE控制台,实现授权cce_admin_trustcce_cluster_agency委托

云容器引擎CCE控制台

在这里插入图片描述

8、委托确认

在这里插入图片描述

2.2 获取OBS桶名

1、创建桶(配置桶名即可,其他默认后续可以修改)-立即创建

在这里插入图片描述

2、桶列表显示则表示创建成功

在这里插入图片描述

2.3 获取AK、SK密钥

1、我的凭证-访问密钥

在这里插入图片描述

2、新增访问密钥

在这里插入图片描述

3、下载密钥

在这里插入图片描述

4、保存密钥,如下获取到了access_key

在这里插入图片描述

5、可以在访问密钥列表中查看访问密钥ID(AK),在下载的.csv文件中查看秘密访问密钥(SK)

在这里插入图片描述

2.4 CCE集群高可用部署

1、点击一键部署(CCE容器高可用部署)

在这里插入图片描述

2、选择模板(默认配置即可)

  • 创建方式:已有模板

  • 模板来源:URL

  • 模板 URL:系统默认

在这里插入图片描述

3、参数配置

配置项名称说明注意事项
cce_node_pool_passwordCCE 集群 node 节点密码,用于集群节点登录需符合密码格式要求(具体格式需参考平台规范,避免因格式错误导致任务回滚)
pgsql_passwordPostgreSQL 数据库的管理员密码取值范围需符合数据库密码强度要求(如长度、字符类型等)
pgsql_user_passwordPostgreSQL 数据库的 database 用户密码同上
redis_passwordRedis 数据库密码需满足 Redis 密码复杂度要求
css_passwordCSS 向量数据库的密码确保与 CSS 服务密码规则一致
obs_bucket填写已创建的 OBS 桶名称需与实际创建的桶名完全一致
access_key访问密钥 ID(AK)从华为云账号中获取有效的 AK
secret_key秘密访问密钥(SK),从下载的.csv 文件中查看需确保 SK 的正确性,避免泄露
ecs_password部署 Embedding 和 Reranker 模型的云服务器密码符合云服务器密码策略(如大小写字母、数字、特殊字符组合)

重要注意事项:

  • 密码格式检查:所有密码需严格遵循对应服务的格式要求(如长度、字符类型、特殊字符限制等),格式错误会导致任务执行时回滚报错
  • 信息准确性:OBS 桶名、AK/SK 等信息需与实际创建的资源完全一致,避免因名称或密钥错误导致认证失败
  • 唯一性验证:创建资源栈前,确认名称未被其他资源栈使用,避免命名冲突

在这里插入图片描述

4、资源栈设置

IAM权限委托:选择上面已经创建的委托

回滚设置和删除保护:可以根据需要开启,默认是关闭,建议开启回滚设置,如果创建失败华为云会自动删除创建的一些列配置,如果不开启需要手动删除非常麻烦

在这里插入图片描述

5、配置确认

确认自己所做的配置有没有问题,如果问题创建执行任务即可,创建执行任务确认即可

在这里插入图片描述

在这里插入图片描述

6、部署-执行

在这里插入图片描述

在这里插入图片描述

7、基本信息-状态等待部署完成即可

在这里插入图片描述

8、等待部署完成(预计10-20分钟)

在这里插入图片描述

在这里插入图片描述

9、浏览器地址访问

在这里插入图片描述

10、通过浏览器访问链接来访问Dify - LLM 应用开发平台

在这里插入图片描述

11、设置的管理员账户信息

在这里插入图片描述

12、登录后显示如下页面,代表Dify - LLM 应用开发平台已经部署成功

在这里插入图片描述

3、Dify平台模型供应商配置

1、Dify - LLM 应用开发平台模型供应商配置(接入DeepSeek)

在这里插入图片描述

2、模型供应商中找到OpenAI-API-compatible并且安装

在这里插入图片描述

3、安装成功如下所示

在这里插入图片描述

4、DeepSeek模型供应商配置(OpenAI-API-compatible供应商)

在这里插入图片描述

5、配置页面

在这里插入图片描述

6、API Key获取:ModelArts Studio控制台,点击API KEY管理,创建自己的API KEY,标签和描述根据自己的填即可,获取到自己的API KEY注意保存(只会显示一次自己的API KEY)

在这里插入图片描述

在这里插入图片描述

7、自定义 API endpoint 地址获取:ModelArts Studio控制台,点击在线推理,选择自己的服务,商用服务或者免费服务的用法相同,点击调用说明获取自定义API endpoint 地址

在这里插入图片描述

8、点击OpenAI SDK复制API接口信息,这个就是自己的API endpoint 地址

在这里插入图片描述

9、Dify - LLM 应用开发平台填写获取到的API KEY和自定义 API endpoint 地址和模型名称

在这里插入图片描述

10、点击保存,页面会显示修改成功,配置成功页面如下

在这里插入图片描述

4、高质量知识库配置Embedding及Rerank模型
4.1 部署Embedding及Rerank模型

1、登录华为云解决方案实践,选择快速部署Embedding及Rerank模型

在这里插入图片描述

2、点击进入-下滑至方案架构

在这里插入图片描述

3、区域选择

成本预算:3~6元(按需计费:Flexus云服务器X实例2.28元/小时,弹性公网IP EIP0.80元/GB,体验本方案预计成本不超过6元)

在这里插入图片描述

4、选择模板

  • 默认配置下一步

在这里插入图片描述

5、参数配置

  • 按模板要求对部分资源加密取消勾选
  • ecs_password:云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种、

在这里插入图片描述

6、资源栈设置

开启回滚设置:开启回滚表示操作失败时,会自动回滚至系统所保存的上一个成功的资源状态。创建后可在资源栈详情页面修改。

在这里插入图片描述

7、配置确认

在这里插入图片描述

8、创建执行计划

在这里插入图片描述

9、部署

在这里插入图片描述

10、执行计划

在这里插入图片描述

11、基本信息中等待状态改变为部署完成即可完成部署

在这里插入图片描述

在这里插入图片描述

4.2 高质量知识库模型供应商配置
4.2.1 ECS公网IP获取

1、ECS公网IP获取

在这里插入图片描述

在这里插入图片描述

4.2.2 Ollama模型安装

1、安装bge-m3(embedding)和bge-reranker-v2-m3 (reranker)模型供应商

  • Ollama安装

在这里插入图片描述

在这里插入图片描述

2、Ollama模型供应商配置

在这里插入图片描述

  • 模型类型:Text Embedding
  • 模型名称:bge-m3
  • 基础URL:http://ECS公网IP:11434(如上前提有获取流程)
  • 端口号:11434

在这里插入图片描述

3、Xorbits Inference模型安装

在这里插入图片描述

在这里插入图片描述

4.2.3 Xorbits Inference模型安装

1、Xorbits Inference模型配置

模型类型: Rerank

模型名称与模型UID均填写:bge-reranker-v2-m3

服务器URL:http://ECS公网IP:9997

端口号:9997

在这里插入图片描述

在这里插入图片描述

2、模型成功配置

在这里插入图片描述
如上即完成了华为云集群部署以及高质量知识库配置Embedding及Rerank模型的创建和配置,后续即可直接在华为云Dify平台中,直接创建高质量知识库,经济知识库默认配置,不需要特殊创建过程。

资源删除销毁

Tip:

  • 删除资源栈的流程官方文档比较详细可以参考官方文档
  • 资源删除销毁单机部署和CCE集群高可用部署的方式相同

1、进入资源编排服务控制台,找到刚创建成功的资源栈,单击行操作列的删除,页面弹出确认删除框,在输入框中再次输入Delete,单击确定,即可删除

在这里插入图片描述

2、如果启用删除保护的情况下删除资源堆栈,则会显示错误消息

在这里插入图片描述

3、只需要将删除保护关闭再删除即可(此处我并未开启所以不做演示)

在这里插入图片描述

华为云CCE高可用集群部署Dify平台

基于华为云 CCE 高可用集群部署 Dify 平台,开发者利用 CCE 多节点冗余、自动扩缩容及网络隔离能力,结合 Dify 微服务架构实现组件弹性扩展,通过华为云 RDS/Redis/EVS 保障数据高可用,以简洁架构快速构建安全可靠的应用环境

高可用性:华为云 CCE 提供多节点冗余架构,控制平面默认 3 个控制节点,通过 etcd 集群保证数据一致性,单节点故障不影响集群运行。工作节点支持自动扩缩容,能根据负载动态调整数量。同时,Dify 平台的组件如数据库采用华为云 RDS for PostgreSQL 高可用版,缓存使用 ElastiCache for Redis 主从架构,确保关键组件的高可用性,实现服务自愈,减少业务中断时间

弹性扩展:CCE 集群支持自动扩缩容,可根据 Dify 平台的业务负载动态调整工作节点数量。Dify 平台本身采用微服务架构,各个组件可独立进行水平扩展,如 Web 服务、API 网关等无状态服务可通过增加副本数量来提升并发处理能力,以应对不同规模的业务流量变化

安全可靠:华为云 CCE 通过 VPC 网络隔离、安全组规则以及 Kubernetes NetworkPolicy 实现网络与安全隔离,保护 Dify 组件通信安全。数据方面,采用云硬盘 EVS 持久化存储,支持多副本数据冗余和自动数据备份,RDS 支持数据静态加密和传输加密,确保 Dify 数据的安全性和完整性。同时,华为云 CCE 服务通过多项安全合规认证,满足企业级的安全合规需求

总结

本文完整呈现了在华为云 CCE 高可用集群部署 Dify 平台并构建大模型知识库的实战过程,涵盖从 ModelArts Studio 开通大模型服务、创建委托与 OBS 桶等准备工作,到 CCE 集群参数配置、模型供应商对接及 Embedding 与 Rerank 模型部署的全流程,帮助开发者高效利用华为云资源,以简洁架构实现 Dify 平台的高可用部署与知识库搭建,快速落地大模型应用开发。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/86072.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/86072.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

测试校招/应届刷题知识路线

需要重点关注计算机基础知识和测试相关技能 对于即将参加校招或应届的同学,测试岗位需要重点关注计算机基础知识和测试相关技能。 掌握操作系统、计算机网络、数据库等计算机基础,同时熟悉测试基础理论、测试方法、自动化测试工具 (如 Selenium、JMeter)和编程语言(如 Py…

华为云Flexus+DeepSeek征文 | 基于华为云的 Dify-LLM 企业级 AI 开发平台部署指南

前言 在人工智能技术迅猛发展的今天,大语言模型(LLM)已成为推动企业智能化转型的核心引擎。然而,如何高效、安全地将 LLM 能力整合到实际业务场景中,仍然是许多开发者面临的挑战。Dify 作为一款开源的 LLM 应用开发平…

Dify×奇墨科技:开源+本土化,破解企业AI落地难题

在人工智能技术迅猛发展的今天,企业亟需高效、安全的AI应用开发工具。开源LLMOps平台Dify.AI凭借其灵活性与开放性,已成为开发者构建AI应用的首选之一。而它在中国市场的规模化落地,离不开本土合作伙伴的强力支撑——奇墨科技作为Dify中国大陆…

Vue3+Spring boot 前后端防抖增强方案

我将基于您提供的防抖切面代码进行改进,主要优化点包括使用Redis实现分布式防抖、增强键生成策略、改进异常处理等。以下是完整的改进方案: 1. 改进的防抖注解 (Debounce.java) java 复制 下载 package com.weiyu.anno;import java.lang.annotation…

Cppcheck 使用教程:本地 + CMake + GitHub Actions 自动分析实战

Cppcheck 是一款强大的 C/C 静态分析工具,专注于发现内存泄漏、未初始化变量、死代码、未使用函数等问题。它不依赖编译器,适合在持续集成和本地开发中快速定位潜在 Bug。 本文将手把手教你如何: 安装 Cppcheck 在命令行中使用 集成到 CMak…

Mac Parallels Desktop Kali 2025 代理设置

Mac Parallels Desktop Kali 2025 代理设置 核心步骤: kali设置桥接wifi 查看kali和主机ip 运行命令ifconfig查看kali ip: mac主机ip: kali设置proxy ip填写主机ip,port为主机proxy端口 enjoy

通义灵码编程智能体深度评测(Qwen3模型+终端操作+MCP工具调用实战)

1 引言 随着AI编程助手进入工具链集成时代,通义灵码作为阿里云推出的智能编程解决方案,其Qwen3模型与MCP(Multi-tool Calling Platform)的协同能力引发开发者关注。本文将基于真实开发场景,从代码理解、终端操作和工具链调用三个维度展开深度…

SpringBoot电脑商城项目--商品详情+加入购物车

商品详情 1. 持久层 1.1. 规划sql语句 根据id查询商品详情 1.2 mapper层编写抽象方法 /*** 根据商品id查询商品详情* param id 商品id* return 匹配的id商品详情,如果没有匹配的数据,则返回null*/Product findById(Integer id); 1.3 xml文件中编写sq…

上交卡尔动力联合提出FastDrive!结构化标签实现自动驾驶端到端大模型更快更强

最近将类人的推理能力融入到端到端自动驾驶系统中已经成为了一个前沿的研究领域。其中,基于视觉语言模型的方法已经吸引了来自工业界和学术界的广泛关注。 现有的VLM训练范式严重依赖带有自由格式的文本标注数据集,如图1(a)所示。虽然这些描述能够捕捉丰…

C# 委托(什么是委托)

什么是委托 可以认为委托是持有一个或多个方法的对象。当然,一般情况下你不会想要“执行”一个对 象,但委托与典型的对象不同。可以执行委托,这时委托会执行它所“持有"的方法。 本章将揭示创建和使用委托的语法和语义。在本章后面&am…

iTwin briefcase, checkpoint ,standalone

在 iTwin.js 中,briefcase 和 checkpoint 都是 IModel 的不同连接类型,但它们的用途和特性不同: Briefcase 用途:用于本地编辑和同步。通常是用户从 iModelHub 检出(Check-out)后在本地生成的可写副本。特…

媒体AI关键技术研究

一、引言 随着人工智能技术的迅猛发展,媒体行业正经历前所未有的变革。AI技术不仅重塑了内容生产和传播模式,更为媒体创意发展提供了全新可能。在数字化、移动化和信息爆炸的大背景下,传统媒体面临巨大挑战,而AI技术为行业带来了…

Cargo 与 Rust 项目

一、Rust 项目:现代化的系统编程单元 Rust 项目 是用 Rust 语言编写的软件工程单元,具有以下核心特征: 核心组件: src/ 目录:存放 Rust 源代码(.rs 文件) Cargo.toml:项目清单文件…

uni-app总结6-配合iOS App项目开发apple watch app

假设你已经用uni-app开发好了一个iOS端的app,现在想要开发一个配套的apple watch app。改怎么去开发呢?是不是一头雾水,这篇文章就会介绍一些apple watch app开发的知识以及如何在uni-app开发的iOS app基础上去开发配套的watch app。 一、apple watch 开发知识 apple watc…

神经网络的本质 逻辑回归 python的动态展示

神经网络的本质 逻辑回归 python的动态展示 逻辑回归运行图相关代码什么是逻辑回归和ai的关系逻辑回归公式流程与实际案例解析**一、逻辑回归的数学公式流程**1. **线性组合阶段**2. **激活函数(Sigmoid)**3. **概率预测与决策**4. **交叉熵损失函数**5.…

sql server中的with 锁各种区别

📘 SQL Server 常用 WITH (Hint) 用法与组合场景对照表 Hint 组合作用说明常见用途是否阻塞他人是否读脏数据备注WITH (NOLOCK)不加共享锁,允许读取未提交数据报表导出、大数据分页❌✅等价于 READ UNCOMMITTED,脏读风险高WITH (HOLDLOCK)保持…

KES数据库部署工具使用

一、启动部署工具 Windows系统 #命令行 ${安装目录}/ClientTools/guitools/DeployTools/deploy.exeLinux系统 #命令行 [rootnode ~]# ${安装目录}/ClientTools/guitools/DeployTools/deploy二、环境配置 1.硬件要求 #都是最小配置 CPU:主流32或64位 内存&#…

TB62211FNG是一款采用时钟输入控制的PWM斩波器的两相双极步进电机驱动器

TB62211FNG是一款采用时钟输入控制的PWM斩波器的两相双极步进电机驱动器。该器件采用BiCD工艺制造,额定电压为40伏/1.0安培。片上电压调节器允许使用单一VM电源控制步进电机。 特点: • 双极性步进电机驱动器 • 脉冲宽度调制(PWM&#xf…

uni-app项目实战笔记24--uniapp实现图片保存到手机相册

前提条件:微信小程序要想实现保存图片到本地相册需要到微信公众平台--小程序--开发管理中配置服务器域名中的downloadFile合法域名: \uniapp提供了saveImageToPhotosAlbum API实现保存的图片到本地相册。下面是它的配置参数: 参数名类型必填…

面试题-定义一个函数入参数是any类型,返回值是string类型,如何写出这个函数,代码示例

在 TypeScript 里,要定义一个入参为any类型、返回值为string类型的函数,可参考下面几种实现方式: 1. 基础实现 直接把入参转换为字符串返回。 function anyToString(input: any): string {return String(input); // 使用String()进行类型转…