华为云Flexus+DeepSeek征文 | 基于华为云ModelArts Studio搭建AnythingLLM聊天助手

华为云Flexus+DeepSeek征文 | 基于华为云ModelArts Studio搭建AnythingLLM聊天助手

  • 引言
  • 一、ModelArts Studio平台介绍
    • 华为云ModelArts Studio简介
    • ModelArts Studio主要特点
  • 二、AnythingLLM介绍
    • AnythingLLM 简介
    • AnythingLLM主要特点
    • AnythingLLM地址
  • 三、安装AnythingLLM应用
    • 下载AnythingLLM软件
    • 安装AnythingLLM工具
  • 四、开通DeepSeek-R1-0528商用服务
    • 访问ModelArts Studio控制台
    • DeepSeek-R1-0528 介绍
    • 开通DeepSeek-R1-0528服务
    • 生成API Key
    • 复制及保存OpenAI SDK信息
  • 五、AnythingLLM基本配置工作
    • 设置系统语言
    • 配置AI提供商
    • 新建工作区
    • 测试对话
  • 六、使用体验
  • 七、实践总结

引言


随着人工智能技术的发展,本地化部署的大语言模型(LLM)逐渐成为构建个性化智能服务的关键。AnythingLLM 作为一个开源的本地聊天助手解决方案,以其高效、安全和易用性受到了广泛关注。借助华为云 ModelArts Studio 强大的 AI 工程化能力,我们能够快速搭建并部署 AnythingLLM,实现从概念到应用的无缝衔接。通过本次实践,我们将展示如何利用华为云的弹性计算资源和一站式服务,轻松创建一个功能强大的私有 AI 助手。


一、ModelArts Studio平台介绍

华为云ModelArts Studio简介

华为云ModelArts Studio是基于ModelArts构建的一站式大模型即服务平台(MaaS),深度整合昇腾算力资源与全链路开发工具,为开发者提供从数据准备、模型训练微调、提示词工程到应用部署的全流程解决方案。平台不仅预置主流开源大模型,还具备海量数据智能预处理、自动化标注、分布式训练及模型自动生成能力,全面覆盖AI模型全生命周期管理。无论是深耕算法的工程师、AI领域初学者,还是寻求智能化转型的企业,都能依托ModelArts Studio的高效开发能力,快速实现AI应用的高质量落地与规模化部署。

  • 华为云ModelArts Studio平台地址:https://www.huaweicloud.com/product/modelarts/studio.html

在这里插入图片描述

ModelArts Studio主要特点

  • 模型全、免配置、免调优、性能优
    业界 SOTA 大模型覆盖度高达 99%,内置最优超参配置,结合昇腾算子优化与显存管理,显著提升训练与推理性能。

  • 开箱即用,一站式模型开发服务
    提供模型调优、压缩、部署、评测等全栈工具,功能覆盖大模型全生命周期,用户无需搭建即可直接使用。

  • 资源一站式按需开通,建设周期短
    计算资源可分钟级获取,支持按需计费、弹性扩缩容,并具备断点续训与故障快速恢复能力。

  • 多服务组合竞争力,一站式应用能力集成
    支持 MCP Server、LangChain、RAG、Agent、Guard、九问等组件即插即用,灵活构建复杂 AI 应用场景。

  • 兼容性强,适配主流框架与自定义需求
    全面支持 TensorFlow、PyTorch、MindSpore 等主流 AI 框架,同时支持用户自研算法框架接入。

二、AnythingLLM介绍

AnythingLLM 简介

AnythingLLM 是由 Mintplex Labs Inc. 开发的一款企业级本地化文档聊天机器人解决方案,是目前全球首个支持完整本地大语言模型(LLM)交互的开源桌面应用。它不仅能够与任何文档内容进行智能对话,还提供强大的向量数据库管理、API 集成和多用户权限控制功能,适用于知识库问答、企业私有化部署、AI 助手构建等多种场景。Everything is local by default —— 模型、文档、聊天记录全部存储于本地,真正实现隐私优先、安全可控。

AnythingLLM主要特点

  • 🔐 无需账户注册,开箱即用,保护用户隐私
  • 💻 全平台支持,兼容 macOS、Windows、Linux
  • ⚙️ 一键安装,无需复杂配置即可快速启动
  • 📁 支持多种文档格式:PDF、TXT、DOCX、CSV、MD 等
  • 💬 双模式聊天体验:保留上下文的对话模式 & 快速问答的查询模式
  • 📚 自动向量化文档,高效处理大型资料库
  • 🔍 引用文献标注功能,回答结果来源清晰可查
  • 🧠 内置 LLM 支持,本地运行无依赖云端服务
  • 📈 成本优化设计,文档嵌入仅需一次费用,节省高达 90%
  • 🌐 开发者友好 API,便于深度集成与定制开发
  • 👥 多用户权限管理,满足团队协作与企业部署需求
  • 🧱 可嵌入网页小部件,轻松集成到网站或平台中
  • ☁️ 支持云端部署,灵活适配本地与在线使用场景

AnythingLLM地址

🚀 官网地址:https://useanything.com
📦 GitHub 地址:https://github.com/Mintplex-Labs/anything-llm


三、安装AnythingLLM应用

下载AnythingLLM软件

AingDesk下载地址:https://anythingllm.com/desktop,我们选择Windows x64位版本进行下载。

在这里插入图片描述

安装AnythingLLM工具

下载AnythingLLMk安装包后,在本地Windows上直接安装即可。

在这里插入图片描述

安装安装提示,依次点击下一步安装即可。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

安装AnythingLLM完成,打开后如下所示:

在这里插入图片描述

四、开通DeepSeek-R1-0528商用服务

访问ModelArts Studio控制台

我们登录华为云官网后,在ModelArts Studio介绍页中(官网地址:https://www.huaweicloud.com/product/modelarts/studio.html),我们点击“ModelArts Studio控制台”后,即可进入ModelArts Studio控制台页面。

在这里插入图片描述

在这里插入图片描述

DeepSeek-R1-0528 介绍

DeepSeek-R1-0528 是 DeepSeek 最新推出的大语言模型版本,专为提升复杂代码生成数学推理能力而设计。该模型在训练数据和算法架构上进行了深度优化,显著提升了以下方面的能力:

  • 逻辑推理准确性
  • 程序生成效率
  • 数学问题求解能力

适用于如自动化编程、科研辅助、金融建模、数据分析等对精度与性能要求极高的高端应用场景,是开发者与研究人员的理想选择。


☁️ 华为云 ModelArts Studio(MaaS 平台)正式接入 DeepSeek-R1-0528

华为云 ModelArts Studio 是一站式 AI 开发平台,现已全面接入 DeepSeek-R1-0528,进一步丰富了其 MaaS(Model as a Service)服务能力

基于 昇腾云的强大算力底座,用户可实现:

一键部署调用
低成本灵活扩展
高效应对复杂AI任务

此次合作不仅显著增强了平台在代码生成数学推理方面的表现,也大幅降低了使用门槛与成本,助力开发者与企业快速构建智能化应用,推动 AI 技术落地。


📌 立即体验 DeepSeek-R1-0528,开启智能开发新篇章!

开通DeepSeek-R1-0528服务

在ModelArts Studio控制台首页的左侧菜单栏中,我们选择模型推理——在线推理,选择商务服务DeepSeek-R1-0528,点击“开通服务”。

在这里插入图片描述

备注:

服务类型描述注意事项
免费服务适合用于体验模型,受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容。
- 单个模型提供200万token推理额度。额度消耗完后可选择开通商用级别的推理API服务或部署为付费服务使用。
商用服务提供商用级别的推理API服务。开通后可获取付费API服务(仅限贵阳一)。
- 用户可以前往费用中心查看模型服务的优惠折扣发放和使用情况。可以前往“我的服务”部署为个人服务后付费使用。

点击“开通服务”后,我们勾选同意协议,确认“立即开通”。

在这里插入图片描述

生成API Key

进入API Key管理页面。可以选择“创建API Key”,注意保存此API Key,建议保存在本地以便后续使用。

在这里插入图片描述

复制及保存OpenAI SDK信息

我们可以查看DeepSeek-R1-0528的使用说明,只需要点击“调用说明”选项。

在这里插入图片描述

调用说明如下所示,我们将DeepSeek-R1-0528服务的OpenAI SDK相关文件复制,保存在本地文本文件或本地笔记中。

在这里插入图片描述

五、AnythingLLM基本配置工作

设置系统语言

点击界面左下角的设置图标,进入系统设置界面。

在这里插入图片描述

在外观——系统偏好——显示语言中,选择显示 AnythingLLM 界面所用的语言设置为Chinese。

在这里插入图片描述

配置AI提供商

🔐 LLM 首选项配置说明

LLM 首选项用于设置你所使用的 大语言模型(LLM)聊天服务与嵌入服务 的提供商凭据和相关参数。为确保 AnythingLLM 能够正常运行,请务必保证所填写的 API 密钥是最新的且准确无误。错误或过期的密钥将导致模型无法调用。

📘 建议参考以下配置信息进行设置,以确保服务顺利连接与运行。

  • LLM提供商:Generic OpenAI(通过自定义配置连接任何兼容 OpenAI API 的服务)
  • Base URL: https://api.modelarts-maas.com
  • API Key: 填写刚才保存的API Key
  • Chat Model Name: deepseek-r1-250528
  • Token context window: 2048 (模型能够处理的输入文本(包括对话历史和当前输入)的最大长度为 2048 个 token,超出此限制的部分将被截断。)
  • Max Tokens: 1024 (模型每次回复时最多生成 1024 个 token 的内容,这决定了输出响应的最大长度。

在这里插入图片描述

新建工作区

在AnythingLLM的主界面中,点击【新工作区】选项。

在这里插入图片描述

填写工作区名称,这里就填写为测试工作区,点击“保存”。

在这里插入图片描述

测试对话

我们先开始在对话框中寻味“你是谁”,AnythingLLM经过深度思考并给出回答。

在这里插入图片描述

六、使用体验

在本次基于 华为云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的实践中,我深刻感受到华为云平台在 AI 工程化落地方面的强大能力。ModelArts Studio 提供了一站式的模型部署、服务管理与接口调试功能,极大简化了 AnythingLLM 的本地大模型运行环境搭建过程。无论是资源配置、容器管理还是公网访问设置,操作都直观高效,即使是初次接触 AI 部署的开发者也能快速上手。更令人印象深刻的是其出色的资源调度能力和稳定的运行表现,即使面对高并发请求,系统依然保持低延迟响应,充分展现了华为云 Flexus 弹性算力和 ModelArts Studio 服务的强大性能。

七、实践总结


🎯 实践总结

在本次基于 华为云 ModelArts Studio 搭建 AnythingLLM AI 聊天助手 的实践中,我深刻体会到华为云在 AI 开发领域的强大支撑能力。ModelArts Studio 提供了从模型部署、服务管理到 API 接口调用的一站式解决方案,极大地简化了本地大语言模型的部署流程。整个过程无需复杂配置,即可快速构建一个稳定、高效的 AI 助手运行环境,真正实现了“开箱即用”的智能开发体验。

⚡ 为什么选择华为云 ModelArts Studio?

  • 高效部署:一键部署 AnythingLLM,支持多种模型接入,操作流畅无卡顿
  • 🔧 灵活配置:资源弹性伸缩,适配不同规模的 AI 应用场景
  • 📊 可视化监控:实时查看服务状态与资源使用情况,运维更轻松
  • ☁️ 云原生架构:依托华为云 Flexus 弹性算力,保障高并发下的稳定响应
  • 🌐 公网访问便捷:内网穿透配置简单,快速对外提供服务

华为云 ModelArts Studio 不仅降低了 AI 开发的技术门槛,更为开发者提供了强大的工具支持与稳定的运行环境。无论是个人学习、团队协作,还是企业级应用落地,它都是值得信赖的选择!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/84508.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

板凳-------Mysql cookbook学习 (十--5)

6.11 计算年龄 2025年6月11日星期三 --创建表、初始化数据 drop table if exists sibling; create table sibling (name char(20),birth date );insert into sibling (name,birth) values(Gretchen,1942-04-14); insert into sibling (name,birth) values(Wilbur,1946-11-28)…

SAP RESTFUL接口方式发布SICF实现全路径

其他相关资料帖可参考: https://blog.csdn.net/woniu_maggie/article/details/146210752 https://blog.csdn.net/SAPmatinal/article/details/134349125 https://blog.csdn.net/weixin_44382089/article/details/128283417 【业务场景】 外部系统不想通过RFC (需…

在windows中安装或卸载nginx

首先在nginx的安装目录下cmd查看nginx的版本: 在看windows的服务中是否nginx注册为服务了 如果注册了服务就先将服务卸载了 在nginx的安装目录cmd执行命令 NginxService.exe uninstall “NginxService”是对应的注册的服务名称 关闭所有的相关nginx的服务这个也…

FaceFusion 技术深度剖析:核心算法与实现机制揭秘

在 AI 换脸技术蓬勃发展的浪潮中,FaceFusion 凭借其出色的换脸效果和便捷的操作,成为众多用户的首选工具。从短视频平台上的创意恶搞视频,到影视制作中的特效合成,FaceFusion 都展现出强大的实用性。而这一切的背后,是…

2. Web网络基础 - 协议端口

深入解析协议端口与netstat命令:网络工程师的实战指南 在网络通信中,协议端口是服务访问的门户。本文将全面解析端口概念,并通过netstat命令实战演示如何监控网络连接状态。 一、协议端口核心知识解析 1. 端口号的本质与分类 端口范围类型说…

嵌入式学习笔记 - freeRTOS vTaskPlaceOnEventList()函数解析

vTaskPlaceOnEventList( &( pxQueue->xTasksWaitingToSend ), xTicksToWait ); 函数第一个参数为消息队列等待插入链表, void vTaskPlaceOnEventList( List_t * const pxEventList, const TickType_t xTicksToWait ) { configASSERT( pxEventList ); /…

Ubuntu 配置使用 zsh + 插件配置 + oh-my-zsh 美化过程

Ubuntu 配置使用 zsh 插件配置 oh-my-zsh 美化过程 引言zsh 安装及基础配置oh-my-zsh 安装及美化配置oh-my-zsh 安装主题美化配置主题自定义主题 插件安装及配置官方插件查看及启用插件安装 主题文件备份.zshrcre5et_self.zsh-theme 同步发布在个人笔记Ubuntu 配置使用 zsh …

Xilinx FPGA 重构Multiboot ICAPE2和ICAPE3使用

一、FPGA Multiboot 本文主要介绍基于IPROG命令的FPGA多版本重构,用ICAP原语实现在线多版本切换。需要了解MultiBoot Fallback点击链接。 如下图所示,ICAP原语可实现flash中n1各版本的动态切换,在工作过程中,可以通过IPROG命令切…

springMVC-11 中文乱码处理

前言 本文介绍了springMVC中文乱码的解决方案,同时也贴出了本人遇到过的其他乱码情况,可以根据自身情况选择合适的解决方案。 其他-jdbc、前端、后端、jsp乱码的解决 Tomcat导致的乱码解决 自定义中文乱码过滤器 老方法,通过javaW…

mysql-innoDB存储引擎事务的原理

InnoDB 存储引擎支持 ACID 事务,其事务机制是通过 Redo Log(重做日志)、Undo Log(回滚日志) 和 事务日志系统 来实现的。下面详细解析 InnoDB 事务的工作原理。 1.事务的基本特性(ACID) 特性描…

在GIS 工作流中实现数据处理

通过将 ArcPy 应用于实际的 GIS 工作流,我们可以高效地完成数据处理任务,节省大量时间和精力。接下来,本文将结合具体案例,详细介绍如何运用 ArcPy 实现 GIS 数据处理的全流程。 数据读取与合并 假设我们有多个 shapefile 文件&a…

第十四届蓝桥杯_省赛B组(C).冶炼金属

题目如下: 拿到题我们来看一下,题目的意思,就是求出N个记录中的最大最小值,言外之意就是,如果超过了这个最大值不行,如果小于这个最小值也不行,所以我们得出,这道题是一个二分答案的题目&#x…

​​Android 如何查看CPU架构?2025年主流架构有哪些?​

在开发安卓应用或选购手机时,了解设备的CPU架构至关重要。不同的架构影响性能、兼容性和能效比。那么,​​如何查看安卓设备的CPU架构?2025年主流架构有哪些?不同架构之间有什么区别?​​ 本文将为你详细解答。 ​​1.…

飞算 JavaAI 2.0.0:开启老项目迭代维护新时代

在软件开发领域,老项目的迭代与维护一直是开发团队面临的难题。代码逻辑混乱、技术栈陈旧、开发效率低下等问题,让老项目改造犹如一场 “噩梦”。而飞算 JavaAI 2.0.0 版本的正式上线,通过三大核心能力升级,为老项目开发带来了全新…

Linux初步介绍

Linux是一种开源的类Unix操作系统内核,广泛应用于服务器、桌面、嵌入式设备等各种计算平台。它由Linus Torvalds于1991年首次开发,因其稳定性、安全性和灵活性,被全球开发者和企业广泛采用。 特点: 开放性(开源&#…

OneNet + openssl + MQTT

1.OneNet 使用的教程 1.在网络上搜索onenet,注册并且登录账号。 2.产品服务-----物联网服务平台立即体验 3.在底下找到立即体验进去 4.产品开发------创建产品 5.关键是选择MQTT,其他的内容自己填写 6.这里产品以及开发完成,接下来就是添加设…

行为设计模式之Memento(备忘录)

行为设计模式之Memento(备忘录) 前言: 备忘录设计模式,有点像vmware快照可以回滚,idea的提交记录同样可以混滚,流程引擎中流程可以撤销到或者回滚到某个指定的状态。 1)意图 在不破坏封装性的…

动画直播如何颠覆传统?解析足球篮球赛事的数据可视化革命

在5G和AI技术快速发展的今天,体育赛事直播正在经历一场深刻的变革。传统视频直播虽然能提供真实的比赛画面,但在战术可视化、数据深度和交互体验方面存在明显短板。而基于实时数据驱动的动画直播技术,正通过创新的方式弥补这些不足&#xff0…

二刷苍穹外卖 day01

nginx nginx反向代理 将前端发送的请求由nginx转发到后端服务器 好处: 提速:nginx本身可缓存数据 负载均衡:配置多台服务器,大量请求来临可均衡分配 保证后端安全:不暴露后端服务真实地址 server{listen 80;server_…

5.2 HarmonyOS NEXT应用性能诊断与优化:工具链、启动速度与功耗管理实战

HarmonyOS NEXT应用性能诊断与优化:工具链、启动速度与功耗管理实战 在HarmonyOS NEXT的全场景生态中,应用性能直接影响用户体验。通过专业的性能分析工具链、针对性的启动速度优化,以及精细化的功耗管理,开发者能够构建"秒…