华为云Flexus+DeepSeek征文 | 华为云ModelArts Studio实战指南:创建高效的AingDesk知识库问答助手

华为云Flexus+DeepSeek征文 | 华为云ModelArts Studio实战指南:创建高效的AingDesk知识库问答助手

  • 前言
  • 一、ModelArts Studio介绍
    • 1. 华为云ModelArts Studio简介
    • 2. 华为云ModelArts Studio主要特点
    • 3. 华为云ModelArts Studio主要使用场景
  • 二、AingDesk介绍
    • 1. AingDesk简介
    • 2. AingDesk 主要特点
  • 三、部署AingDesk项目
    • 1. 创建容器工作
    • 2. 查看容器状态
    • 3. 本地访问服务
  • 四、访问AingDesk服务
    • 1. 进入账号注册页
    • 2. 设置用户名和密码
    • 3. 登录AingDesk
  • 五、ModelArts Studio平台开通DeepSeek商用服务
    • 1. 进入ModelArts Studio控制台
    • 2. 在线推理各服务介绍
    • 3. 开通DeepSeek商用服务
    • 4. 保存API信息
  • 六、AingDesk基本配置
    • 1. AI配置流程
    • 2. 对话测试
  • 七、知识库问答配置与使用
    • 1. 配置嵌入模型
    • 2. 新建知识库
    • 3. 上传文件
    • 4. 知识库问答
  • 八、总结

前言


在智能问答需求日益增长的今天,华为云ModelArts Studio凭借其强大的功能,为打造高效的AingDesk知识库问答助手提供了可靠的技术支撑。本文作为实战指南,将从基础概念讲解到具体操作流程,逐步引导读者掌握如何借助ModelArts Studio,完成AingDesk知识库问答助手的创建与优化,助力企业提升智能化服务水平。


一、ModelArts Studio介绍

1. 华为云ModelArts Studio简介

华为云ModelArts Studio是基于ModelArts的一站式大模型即服务平台(MaaS),提供从模型开发、训练到部署的全流程能力,支持主流开源大模型的快速适配与优化,助力企业高效构建AI应用。

  • 华为云ModelArts Studio平台官网:https://www.huaweicloud.com/product/modelarts/studio.html

在这里插入图片描述

2. 华为云ModelArts Studio主要特点

  • 模型全面:集成Llama、Baichuan、Yi、Qwen、DeepSeek等主流开源大模型,并基于昇腾AI云服务进行性能与精度优化。
  • 免配置、免调优:提供一键式训练、自动超参调优功能,降低模型开发门槛,显著缩短开发周期。
  • 性能优异:通过昇腾算子优化与显存管理,实现大模型训练与推理性能大幅提升。
  • 资源灵活易获取:支持按需开通、弹性扩缩容,保障高性价比的算力使用,同时支持断点续训与故障恢复。
  • 一站式工具链:涵盖模型调优、压缩、评测、部署等全生命周期工具,开箱即用,低门槛上手。
  • 多组件集成能力强:支持LangChain、RAG、Agent、Guard等多种AI组件即插即用,快速构建复杂AI应用系统。

3. 华为云ModelArts Studio主要使用场景

  1. 智能问答系统:基于预训练大模型快速构建知识库驱动的问答系统,提升信息检索效率。
  2. 企业级AI助手开发:利用平台提供的Prompt模板和智能Agent能力,打造能理解任务并自主决策的企业AI助手。
  3. 个性化内容生成:适用于新闻撰写、营销文案、客服回复等内容创作类任务,提升内容生产效率。
  4. 多模态AI应用构建:结合图像、语音、文本等多模态数据,开发智能客服、虚拟主播等综合型AI产品。

二、AingDesk介绍

1. AingDesk简介

AingDesk 是一款简单易用的人工智能助手,旨在为用户提供高效、便捷的AI服务体验。它集成了多种强大功能,包括本地知识库支持、主流模型API调用、在线分享能力、联网搜索、智能体创建等,并且正在不断快速进化中。无论是个人用户还是企业用户,都能通过 AingDesk 轻松部署和使用人工智能技术。

2. AingDesk 主要特点

  1. 一键部署本地AI模型与主流模型API:用户可以轻松部署本地AI模型或调用主流模型API,无需复杂的配置流程。
  2. 本地知识库支持:提供强大的本地知识库管理功能,帮助用户构建专属的知识体系。
  3. 智能体创建:支持用户创建个性化的智能代理,实现自动化任务处理和交互。
  4. 在线分享功能:可将工作成果一键分享给他人,便于协作与传播。
  5. 支持网页搜索:内置联网搜索功能,实时获取最新信息,拓展知识边界。
  6. 支持服务器端部署:适用于企业级应用场景,支持在服务器端进行稳定高效的部署。
  7. MCP客户端支持:兼容MCP(Model Control Protocol)客户端,增强模型控制与交互能力。
  8. 单次对话中同时与多个模型交流(即将上线):未来将支持在一个会话窗口中同时与多个AI模型互动,提升工作效率。

三、部署AingDesk项目

1. 创建容器工作

请下载镜像名称为aingdesk/aingdesk:latest,版本标签为 latest 的最新版本。

docker pull aingdesk/aingdesk:latest

在这里插入图片描述

本次实践所使用的操作系统为 openEuler 24.03 (LTS),需提前完成 Docker 环境的部署。可以通过 Docker 命令行方式进行部署,也可选择使用 Docker Compose 进行部署,推荐采用 Docker Compose 方式以提升部署效率和管理便捷性。

  • Docker命令行方式:使用以下命令快速创建容器。
docker run -d \--name node \-v $(pwd)/data:/data \-v $(pwd)/uploads:/uploads \-v $(pwd)/logs:/logs \-v $(pwd)/bin:/aingdesk/bin \-v $(pwd)/sys_data:/sys_data \-p 7071:7071 \-w /aingdesk \aingdesk/aingdesk
  • Docker compose方式:创建以下部署文件docker-compose.yaml,内容如下所示。
vim docker-compose.yaml
version: '3'services:aingdesk:image: aingdesk/aingdeskcontainer_name: aingdeskrestart: unless-stoppedports:- "7071:7071"volumes:- /docker/aningdesk/data:/data- /docker/aningdesk/uploads:/uploads- /docker/aningdesk/logs:/logs- /docker/aningdesk/bin:/aingdesk/bin- /docker/aningdesk/sys_data:/sys_data 

开始创建AingDesk容器,推荐使用以下 Docker Compose 命令快速启动并后台运行容器:

docker compose up -d

在这里插入图片描述

2. 查看容器状态

检查我们刚才创建的AingDesk容器状态,可以看到该容器已经正常运行了。

[root@node01-server aningdesk]# docker ps
CONTAINER ID   IMAGE               COMMAND           CREATED          STATUS                             PORTS  NAMES
02668c853f4a   aingdesk/aingdesk   "npm run start"   29 seconds ago   Up 28 seconds (health: starting)   0.0.0.0:7071->7071/tcp, :::7071->7071/tcp  aingdesk

检查容器日志,排查可能存在的错误或异常信息,确保 AingDesk 服务稳定正常运行。

[root@node01-server aningdesk]# docker compose logs
WARN[0000] /docker/aningdesk/docker-compose.yaml: `version` is obsolete
aingdesk  |
aingdesk  | > aingdesk@1.1.9 start
aingdesk  | > node ./public/internal/main.js
aingdesk  |
aingdesk  | [socket/http] server is: http://127.0.0.1:7071

3. 本地访问服务

在完成部署后,可通过本机访问 AingDesk 服务,以确认服务是否正常运行。在部署服务器上,可使用 curl 命令测试访问服务接口,确保能够成功获取响应,从而验证服务的可用性。

 curl 127.0.0.1:7071

在这里插入图片描述

四、访问AingDesk服务

1. 进入账号注册页

在本地浏览器中输入 http://【本地IP地址】:7071,即可访问AingDesk的服务界面。首次进入后,可以看到账号密码设置页面,如下所示:

在这里插入图片描述

2. 设置用户名和密码

在AingDesk的初始页面,我们自行设置账号密码,如下所示:

在这里插入图片描述

3. 登录AingDesk

注册账号完毕后,使用新注册账号密码重新登录AingDesk,即可进入到AingDesk首页。

在这里插入图片描述

五、ModelArts Studio平台开通DeepSeek商用服务

1. 进入ModelArts Studio控制台

访问华为云官网并点击“ModelArts Studio控制台”后,即可直接进入ModelArts Studio控制台,开启我们的AI开发与管理之旅。

  • 官网地址:https://www.huaweicloud.com/product/modelarts/studio.html)

在这里插入图片描述

2. 在线推理各服务介绍

🚀 在线推理服务说明

在线推理是指模型通过API接口对外提供服务,支持实时调用和体验,并可通过控制台监控面板查看运行状态和服务性能。

🔍 服务类型概览

类型描述计费方式特点说明
预置服务平台已部署完成的服务,可立即使用,无需等待模型加载按Token计费快速测试、无等待时间
我的服务用户自定义部署的服务,支持调优、压缩或自研模型按算力计费自主控制、灵活适配业务需求
免费服务提供基础模型体验功能,适用于学习和初步测试免费存在速率限制,平台不定期调整
商用服务面向企业级应用,提供稳定、高性能的API服务按Token计费支持高并发、适合生产环境部署使用

💰 计费规则说明

  • 免费服务额度:每个模型提供 200万token推理额度,额度耗尽后可:
    • 开通商用级别的推理API服务(仅限区域:贵阳一)
    • 或将模型部署为“我的服务”后按需付费使用

提示:模型服务的优惠折扣信息请前往【费用中心】查看。

💬 推理服务计费详情(单位:元 / 千 tokens)

模型名称状态输入价格(¥)输出价格(¥)备注
Qwen3-235B-A22B-32K未开通0.0020.008商用服务模型
DeepSeek-V3-32K已开通0.0020.008商用服务模型
DeepSeek-R1-32K已开通0.0040.016商用服务模型
Qwen3-32B-32K已开通0.0020.008商用服务模型
DeepSeek-R1-32K-0528已开通0.0040.016商用服务模型

3. 开通DeepSeek商用服务

在ModelArts Studio控制台首页左侧菜单栏中,选择 模型推理 > 在线推理,然后依次选中所需的商用服务模型 —— DeepSeek-R1-0528DeepSeek-V3-32KDeepSeek-R1-32K,点击“开通服务”即可完成配置。

在这里插入图片描述

4. 保存API信息

我们以DeepSeek-V3-32K商用服务为例,点击【调用说明】,查看其OpenAI SDK信息。

在这里插入图片描述

将OpenAI SDK信息的接口信息保存在本地,如下所示:
在这里插入图片描述

在 API Key 管理页面中,点击【创建 API Key】按钮,生成所需的 API 密钥。创建完成后,将生成的 API Key 与 OpenAI SDK 的接口信息一并保存,以便后续调用和配置使用。
在这里插入图片描述

六、AingDesk基本配置

1. AI配置流程

  • 点击主界面的【第三方模型API】,进入模型配置界面。

在这里插入图片描述

  • 我们选择【添加模型服务商】,进入模型服务商配置页面。

在这里插入图片描述

供应商配置项,可参考如下:

  • 供应商名称:华为云
  • 接口地址:https://api.modelarts-maas.com/v1
  • 密钥:刚才注册的申请的华为云API key
  • 设置完毕后,点击保存。

在这里插入图片描述

  • 检查模型名称:选择我们刚才创建的【华为云】服务商,可以所有模型都已经正常识别出来了。

在这里插入图片描述

2. 对话测试

在 AI 对话页面进行简单的提问测试后,可以看到模型能够正常返回回答,这表明 AI 模型已成功配置并正常运行。

在这里插入图片描述

七、知识库问答配置与使用

1. 配置嵌入模型

在第三方 API 配置中,我们选择“硅基流动”平台。将从其官网注册获取的 API Key 复制并粘贴至对应的 API 密钥输入框后,点击【检查】和【保存API】按钮,即可成功识别并加载该平台下所有的模型列表。

在这里插入图片描述

2. 新建知识库

在 AingDesk 主界面左侧点击【知识库】→【新建知识库】,填写知识库名称和描述后,系统将自动识别到硅基流动平台中的 BAAI/bge-m3 嵌入模型。其他参数保持默认设置,确认无误后点击【确认】完成创建。

在这里插入图片描述

3. 上传文件

点击【上传文件】按钮,将本地文件上传至 AingDesk,随后点击【确认】。上传完成后,AingDesk 将自动对文档内容进行嵌入处理,完成知识入库。

在这里插入图片描述
在这里插入图片描述

4. 知识库问答

点击【新建对话】,在弹出的对话框中,于知识库选项里勾选此前创建的“Linux知识库”,完成配置后即可开始基于该知识库的智能问答与交互。

在这里插入图片描述

我们可以基于该知识库进行提问,例如询问“Linux基础命令有哪些”。可以看到,AingDesk 会根据此前创建的知识库内容进行智能检索,并准确给出相关回答,效果非常理想。

在这里插入图片描述

八、总结


通过本次实战操作,我们成功基于 华为云 FlexusDeepSeek 大模型,在 ModelArts Studio 平台上搭建了一个高效、智能的 AingDesk 知识库问答助手。🚀

从知识库构建、模型部署到问答集成,整个流程高效稳定,充分体现了华为云平台的强大算力支持、灵活的资源配置和出色的 AI 工程能力。💡无论是企业级应用还是个人开发者,都能在华为云上获得一站式、低门槛、高性能的 AI 开发体验。

📣 选择华为云,让AI落地更简单,让智能触手可及!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/web/86616.shtml
繁体地址,请注明出处:http://hk.pswp.cn/web/86616.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NLP基础1_word-embedding

基于github项目:https://github.com/shibing624/nlp-tutorial/tree/main 自然语言处理任务 1) 简单任务 拼写检查 Spell Checking 关键词检索 Keyword Search 同义词查找 Finding Synonyms 2) 中级任务 解析来自网站、文档等的信息 3) 复杂任务 机器翻译 Ma…

ClickHouse系列--BalancedClickhouseDataSource实现

clickhouse-jdbc中负载均衡数据源的实现。 基本逻辑如下: 1.通过配置的url串,来切分构造url列表; 2.通过一个定时线程任务,来不断的去ping url列表,来更新可用的url列表; 3.在可用列表中随机返回一个可用ur…

Linux目录说明

Linux Filesystem Hierarchy Standard(FHS) 1. /bin 全称:Binary(二进制文件)功能:存放系统最基础的可执行命令,所有用户(包括普通用户)都能使用,用于系统启…

鸿蒙 Grid 与 GridItem 深度解析:二维网格布局解决方案

一、引言:网格布局 —— 多维度数据展示的黄金方案 在鸿蒙应用开发体系中,网格布局作为处理多元素有序排列的核心方案,广泛应用于电商商品陈列、图片画廊、功能矩阵等场景。鸿蒙提供的 Grid 与 GridItem 组件通过声明式语法构建灵活的二维布…

​​Vue 开发环境配置:使用 devServer.proxy 解决跨域问题​-vue中文件vue.config,js中配置devserver做反向代理到后端

​​Vue 开发环境配置:使用 devServer.proxy 解决跨域问题​​ ​​引言​​ 在现代 Web 开发中,前端和后端通常独立开发,前端运行在 http://localhost:8080,而后端可能运行在 http://localhost:8000 或其他端口。由于浏览器的 …

JVM 中的 GC 算法演进之路!(Serial、CMS、G1 到 ZGC)

引言 想象一下,Java 程序运行就像在一个巨大的图书馆里借书还书。这个图书馆(JVM 的内存堆区)为了高效运转,需要一个聪明的“图书管理员”来清理失效的书籍(垃圾对象)。这,就是垃圾回收器&#…

(9)python+playwright自动化测试-页面(page)

1.简介 通过前边的讲解和学习,细心认真地你可能发现在Playwright中,没有Element这个概念,只有Page的概念,Page不仅仅指的是某个页面,例如页面间的跳转等,还包含了所有元素、事件的概念,所以我们…

《自动控制原理 》- 第 1 章 自动控制的基本原理与方式

1-1 自动控制的基本原理与方式 自动控制是指在没有人直接参与的情况下,利用外加的设备或装置,使机器、设备或生产过程的某个工作状态或参数按照预定的规律运行。自动控制的核心原理是反馈控制,即通过将系统的输出量回送到输入端,与…

DL00715-基于YOLOv11的水面漂浮物目标检测含数据集

【论文必备】基于YOLOv11的水面漂浮物目标检测——让你的研究走在科技前沿! 在环境监测、海洋保护和水质管理领域,水面漂浮物的检测一直是一个亟待解决的难题。传统的人工巡检方式不仅耗时费力,还无法覆盖广泛的水域范围。如今,基…

权电阻网络DAC实现电压输出型数模转换Multisim电路仿真——硬件工程师笔记

目录 1 基础知识 1.1 运算放大器在DAC中的作用 1.2 常见的基于运算放大器的DAC电路 1.2.1 倒T形电阻网络DAC 1.2.2 权电阻网络DAC 1.2.3 开关电容DAC 1.3 运算放大器的选择 1.4 设计注意事项 2 仿真实验 2.1 权电阻网络DAC实现数字0对应电压输出 2.2 权电阻网络DAC实…

Redis主从集群

✅ 一、什么是 Redis 主从集群? Redis 主从(Master-Slave)集群是一种最基础的集群方式: 一台 Redis 作为主节点(Master),负责写操作; 一到多台 Redis 作为从节点(Slave&…

【水印论文阅读1】将水印规则的定义域从离散的符号空间转移到连续的语义空间

【水印论文阅读1】将水印规则的定义域从离散的符号空间转移到连续的语义空间 写在最前面**为什么“token序列空间”有根本缺陷?****为什么“语义向量空间”能破局?****1. 连续性(抗攻击的核心)****2. 高维复杂性(防破解…

Glide缓存机制

一、缓存层级与设计目标 双级缓存: 内存缓存:弱引用 LruCache 磁盘缓存:DiskLruCache 设计目标: 减少网络流量消耗 避免Bitmap频繁创建/销毁引发的GC 提升图片加载速度 二、内存缓存机制 1. 双缓存结构 缓存类型存储对象…

BaiduSitemap - Typecho站点地图生成与多搜索引擎推送插件

文章目录 🌐 BaiduSitemap - Typecho站点地图生成与多搜索引擎推送插件✨ 功能特点🧩 插件架构核心模块文件结构📦 安装方法方法一:手动安装方法二:Git克隆⚙️ 配置说明站点地图基本设置搜索引擎配置百度搜索引擎必应(Bing)搜索引擎谷歌(Google)搜索引擎🚀 使用…

androidx中<layout>根布局的意义及用法

在 Android 开发中,<layout> 根布局是 Android Jetpack Data Binding 库的核心组件,用于声明该 XML 布局文件将使用数据绑定功能。以下是详细说明: 📌 一、基本作用 1. 启用数据绑定 <layout> 标签标志着此布局文件支持数据绑定,编译器会为其生成对应的绑定类…

QTreeWidget 简单使用

效果图&#xff1a; 关键代码&#xff1a; void MainProj::_InitTree() { connect(m_pTreeWidget, SIGNAL(itemClicked(QTreeWidgetItem*, int)), this, SLOT(TreeItemClicked(QTreeWidgetItem*, int))); m_pTreeWidget->header()->setHidden(1); /*QTreeWid…

手势-handpose的pipeline介绍

手势-handpose的pipeline包括&#xff1a; 1、手部检测算法&#xff1a;单帧检测出左右手的边界框。 2、手部跟踪算法&#xff1a;连续帧跟踪&#xff0c;锁定左右手跟踪目标&#xff0c;作为后续的手部ui操作。 3、手部关键点检测算法&#xff1a;基于单帧的检测框图像作为输…

计算机操作系统(十七)内存管理

计算机操作系统&#xff08;十七&#xff09;内存管理 前言一、内存的使用与程序重定位&#xff08;一&#xff09;内存是什么&#xff1f;&#xff08;二&#xff09;程序的重定位过程&#xff08;三&#xff09;总结&#xff1a;内存使用的核心问题 二、连续分区管理&#xf…

【编译原理】期末

单选题 (4分) 令文法G[E]为&#xff1a;E->ET | T T->T*F | F F-> (E) | i 句型 F*iT 的最左素短语是&#xff08; &#xff09; A.F B.i C.T D.F*i B 短语&#xff1a; F*iT、F*i、F、i 素短语&#xff1a; i 最左素短语&#xff1a; i 单选题 (4分) 若在…

一个简单测试Deepseek吞吐量的脚本,国内环境可跑

一个简单测试Deepseek吞吐量的脚本,这里用DeepSeek-R1-Distill-Qwen-32B ,支持单卡4090 24G可跑,具体看你的硬件情况做调整,理论支持所有的模型,看你需要,可以修改模型名称,重点是pip使用国内的源,模型下载用阿里的ModelScope,无障碍下载,使用. 最后可以生成一个txt与html报表.…