华为云Flexus+DeepSeek征文 | 基于华为云ModelArts Studio搭建AnythingLLM聊天助手
- 引言
- 一、ModelArts Studio平台介绍
- 华为云ModelArts Studio简介
- ModelArts Studio主要特点
- 二、AnythingLLM介绍
- AnythingLLM 简介
- AnythingLLM主要特点
- AnythingLLM地址
- 三、安装AnythingLLM应用
- 下载AnythingLLM软件
- 安装AnythingLLM工具
- 四、开通DeepSeek-R1-0528商用服务
- 访问ModelArts Studio控制台
- DeepSeek-R1-0528 介绍
- 开通DeepSeek-R1-0528服务
- 生成API Key
- 复制及保存OpenAI SDK信息
- 五、AnythingLLM基本配置工作
- 设置系统语言
- 配置AI提供商
- 新建工作区
- 测试对话
- 六、使用体验
- 七、实践总结
引言
随着人工智能技术的发展,本地化部署的大语言模型(LLM)逐渐成为构建个性化智能服务的关键。AnythingLLM 作为一个开源的本地聊天助手解决方案,以其高效、安全和易用性受到了广泛关注。借助华为云 ModelArts Studio
强大的 AI 工程化能力,我们能够快速搭建并部署 AnythingLLM,实现从概念到应用的无缝衔接。通过本次实践,我们将展示如何利用华为云的弹性计算资源和一站式服务,轻松创建一个功能强大的私有 AI 助手。
一、ModelArts Studio平台介绍
华为云ModelArts Studio简介
华为云ModelArts Studio
是基于ModelArts构建的一站式大模型即服务平台(MaaS),深度整合昇腾算力资源与全链路开发工具,为开发者提供从数据准备、模型训练微调、提示词工程到应用部署的全流程解决方案。平台不仅预置主流开源大模型,还具备海量数据智能预处理、自动化标注、分布式训练及模型自动生成能力,全面覆盖AI模型全生命周期管理。无论是深耕算法的工程师、AI领域初学者,还是寻求智能化转型的企业,都能依托ModelArts Studio的高效开发能力,快速实现AI应用的高质量落地与规模化部署。
华为云ModelArts Studio平台地址
:https://www.huaweicloud.com/product/modelarts/studio.html
ModelArts Studio主要特点
-
✅ 模型全、免配置、免调优、性能优
业界 SOTA 大模型覆盖度高达 99%,内置最优超参配置,结合昇腾算子优化与显存管理,显著提升训练与推理性能。 -
✅ 开箱即用,一站式模型开发服务
提供模型调优、压缩、部署、评测等全栈工具,功能覆盖大模型全生命周期,用户无需搭建即可直接使用。 -
✅ 资源一站式按需开通,建设周期短
计算资源可分钟级获取,支持按需计费、弹性扩缩容,并具备断点续训与故障快速恢复能力。 -
✅ 多服务组合竞争力,一站式应用能力集成
支持 MCP Server、LangChain、RAG、Agent、Guard、九问等组件即插即用,灵活构建复杂 AI 应用场景。 -
✅ 兼容性强,适配主流框架与自定义需求
全面支持 TensorFlow、PyTorch、MindSpore 等主流 AI 框架,同时支持用户自研算法框架接入。
二、AnythingLLM介绍
AnythingLLM 简介
AnythingLLM
是由 Mintplex Labs Inc. 开发的一款企业级本地化文档聊天机器人解决方案,是目前全球首个支持完整本地大语言模型(LLM)交互的开源桌面应用。它不仅能够与任何文档内容进行智能对话,还提供强大的向量数据库管理、API 集成和多用户权限控制功能,适用于知识库问答、企业私有化部署、AI 助手构建等多种场景。Everything is local by default —— 模型、文档、聊天记录全部存储于本地,真正实现隐私优先、安全可控。
AnythingLLM主要特点
- 🔐 无需账户注册,开箱即用,保护用户隐私
- 💻 全平台支持,兼容 macOS、Windows、Linux
- ⚙️ 一键安装,无需复杂配置即可快速启动
- 📁 支持多种文档格式:PDF、TXT、DOCX、CSV、MD 等
- 💬 双模式聊天体验:保留上下文的对话模式 & 快速问答的查询模式
- 📚 自动向量化文档,高效处理大型资料库
- 🔍 引用文献标注功能,回答结果来源清晰可查
- 🧠 内置 LLM 支持,本地运行无依赖云端服务
- 📈 成本优化设计,文档嵌入仅需一次费用,节省高达 90%
- 🌐 开发者友好 API,便于深度集成与定制开发
- 👥 多用户权限管理,满足团队协作与企业部署需求
- 🧱 可嵌入网页小部件,轻松集成到网站或平台中
- ☁️ 支持云端部署,灵活适配本地与在线使用场景
AnythingLLM地址
🚀 官网地址:https://useanything.com
📦 GitHub 地址:https://github.com/Mintplex-Labs/anything-llm
三、安装AnythingLLM应用
下载AnythingLLM软件
AingDesk下载地址:https://anythingllm.com/desktop,我们选择Windows x64位版本进行下载。
安装AnythingLLM工具
下载AnythingLLMk安装包后,在本地Windows上直接安装即可。
安装安装提示,依次点击下一步安装即可。
安装AnythingLLM完成,打开后如下所示:
四、开通DeepSeek-R1-0528商用服务
访问ModelArts Studio控制台
我们登录华为云官网后,在ModelArts Studio介绍页中(官网地址:https://www.huaweicloud.com/product/modelarts/studio.html),我们点击“ModelArts Studio控制台”后,即可进入ModelArts Studio控制台页面。
DeepSeek-R1-0528 介绍
DeepSeek-R1-0528 是 DeepSeek 最新推出的大语言模型版本,专为提升复杂代码生成与数学推理能力而设计。该模型在训练数据和算法架构上进行了深度优化,显著提升了以下方面的能力:
- 逻辑推理准确性
- 程序生成效率
- 数学问题求解能力
适用于如自动化编程、科研辅助、金融建模、数据分析等对精度与性能要求极高的高端应用场景,是开发者与研究人员的理想选择。
☁️ 华为云 ModelArts Studio(MaaS 平台)正式接入 DeepSeek-R1-0528
华为云 ModelArts Studio 是一站式 AI 开发平台,现已全面接入 DeepSeek-R1-0528,进一步丰富了其 MaaS(Model as a Service)服务能力。
基于 昇腾云的强大算力底座,用户可实现:
✅ 一键部署调用
✅ 低成本灵活扩展
✅ 高效应对复杂AI任务
此次合作不仅显著增强了平台在代码生成与数学推理方面的表现,也大幅降低了使用门槛与成本,助力开发者与企业快速构建智能化应用,推动 AI 技术落地。
📌 立即体验 DeepSeek-R1-0528,开启智能开发新篇章!
开通DeepSeek-R1-0528服务
在ModelArts Studio控制台首页的左侧菜单栏中,我们选择模型推理——在线推理,选择商务服务DeepSeek-R1-0528,点击“开通服务”。
备注:
服务类型 | 描述 | 注意事项 |
---|---|---|
免费服务 | 适合用于体验模型,受严格的速率限制。 | 平台可能会不定时调整其适用模型、免费额度、有效期等内容。 |
- 单个模型提供200万token推理额度。 | 额度消耗完后可选择开通商用级别的推理API服务或部署为付费服务使用。 | |
商用服务 | 提供商用级别的推理API服务。 | 开通后可获取付费API服务(仅限贵阳一)。 |
- 用户可以前往费用中心查看模型服务的优惠折扣发放和使用情况。 | 可以前往“我的服务”部署为个人服务后付费使用。 |
点击“开通服务”后,我们勾选同意协议,确认“
立即开通
”。
生成API Key
进入API Key管理页面。可以选择“创建API Key”,注意保存此API Key,建议保存在本地以便后续使用。
复制及保存OpenAI SDK信息
我们可以查看DeepSeek-R1-0528的使用说明,只需要点击“调用说明”选项。
调用说明如下所示,我们将DeepSeek-R1-0528服务的OpenAI SDK相关文件复制,保存在本地文本文件或本地笔记中。
五、AnythingLLM基本配置工作
设置系统语言
点击界面左下角的设置图标,进入系统设置界面。
在外观——系统偏好——显示语言中,选择显示 AnythingLLM 界面所用的语言设置为Chinese。
配置AI提供商
🔐 LLM 首选项配置说明
LLM 首选项用于设置你所使用的 大语言模型(LLM)聊天服务与嵌入服务 的提供商凭据和相关参数。为确保 AnythingLLM 能够正常运行,请务必保证所填写的 API 密钥是最新的且准确无误。错误或过期的密钥将导致模型无法调用。
📘 建议参考以下配置信息进行设置,以确保服务顺利连接与运行。
LLM提供商
:Generic OpenAI(通过自定义配置连接任何兼容 OpenAI API 的服务)Base URL
: https://api.modelarts-maas.comAPI Key
: 填写刚才保存的API KeyChat Model Name
: deepseek-r1-250528Token context window
: 2048 (模型能够处理的输入文本(包括对话历史和当前输入)的最大长度为 2048 个 token,超出此限制的部分将被截断。)Max Tokens
: 1024 (模型每次回复时最多生成 1024 个 token 的内容,这决定了输出响应的最大长度。
新建工作区
在AnythingLLM的主界面中,点击【新工作区】选项。
填写工作区名称,这里就填写为测试工作区,点击“保存”。
测试对话
我们先开始在对话框中寻味“你是谁”,AnythingLLM经过深度思考并给出回答。
六、使用体验
在本次基于 华为云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的实践中,我深刻感受到华为云平台在 AI 工程化落地方面的强大能力。ModelArts Studio 提供了一站式的模型部署、服务管理与接口调试功能,极大简化了 AnythingLLM 的本地大模型运行环境搭建过程。无论是资源配置、容器管理还是公网访问设置,操作都直观高效,即使是初次接触 AI 部署的开发者也能快速上手。更令人印象深刻的是其出色的资源调度能力和稳定的运行表现,即使面对高并发请求,系统依然保持低延迟响应,充分展现了华为云 Flexus 弹性算力和 ModelArts Studio 服务的强大性能。
七、实践总结
🎯 实践总结
在本次基于 华为云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的实践中,我深刻体会到华为云在 AI 开发领域的强大支撑能力。ModelArts Studio 提供了从模型部署、服务管理到 API 接口调用的一站式解决方案,极大地简化了本地大语言模型的部署流程。整个过程无需复杂配置,即可快速构建一个稳定、高效的 AI 助手运行环境,真正实现了“开箱即用”的智能开发体验。
⚡ 为什么选择华为云 ModelArts Studio?
- ✅ 高效部署:一键部署 AnythingLLM,支持多种模型接入,操作流畅无卡顿
- 🔧 灵活配置:资源弹性伸缩,适配不同规模的 AI 应用场景
- 📊 可视化监控:实时查看服务状态与资源使用情况,运维更轻松
- ☁️ 云原生架构:依托华为云 Flexus 弹性算力,保障高并发下的稳定响应
- 🌐 公网访问便捷:内网穿透配置简单,快速对外提供服务
华为云 ModelArts Studio 不仅降低了 AI 开发的技术门槛,更为开发者提供了强大的工具支持与稳定的运行环境。无论是个人学习、团队协作,还是企业级应用落地,它都是值得信赖的选择!