华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

  • 前言
  • 一、华为云ModelArts Studio平台介绍
    • 1.1 ModelArts Studio介绍
    • 1.2 ModelArts Studio主要特点
    • 1.3 ModelArts Studio使用场景
    • 1.4 ModelArts Studio产品架构
  • 二、访问ModelArts Studio大模型即服务平台
    • 2.1 登录华为云
    • 2.2 进入ModelArts Studio介绍页
    • 2.3 进入ModelArts Studio控制台
    • 2.4 配置ModelArts委托授权
    • 2.5 华为云账号充值
  • 三、开通DeepSeek-V3/R1商用服务
    • 3.1 预置服务介绍
    • 3.2 开通商用服务DeepSeek-V3-32K
    • 3.3 开通商用服务DeepSeek-R1-32K
  • 四、商用服务DeepSeek-V3/R1对比
  • 五、商用服务DeepSeek-V3/R1在线体验
    • 5.1 DeepSeek-V3-32K在线体验
    • 5.2 DeepSeek-R1-32K在线体验
    • 5.3 DeepSeek-V3/R1调用统计功能
  • 六、使用体验与总结

前言


华为云ModelArts Studio作为一站式大模型即服务平台,凭借其强大的模型管理能力和简洁易用的操作界面,为企业和开发者提供了高效、稳定的AI服务部署体验。平台全面支持主流大模型的快速接入与商用服务开通,显著降低了AI应用开发的技术门槛。通过集成自动调优、资源按需分配、API调用监控等智能功能,ModelArts Studio实现了从模型训练到生产落地的无缝衔接。本文将以部署DeepSeek-V3和DeepSeek-R1商用服务为例,带您深入了解这一平台的强大能力与实际应用价值。


一、华为云ModelArts Studio平台介绍

1.1 ModelArts Studio介绍

🌟 平台介绍

ModelArts Studio是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。

📌 核心价值图谱

维度价值体现
技术门槛零代码开发,免调优,降低90%技术投入
成本效率按需付费,资源利用率提升60%,成本下降50%
开发效率开发周期缩短至传统方案的1/3
业务创新聚焦业务逻辑,快速落地差异化AI应用

👉 立即体验:通过ModelArts Studio,让大模型成为企业数字化转型的核心驱动力,解锁智能未来!

在这里插入图片描述

1.2 ModelArts Studio主要特点

  1. 全栈模型生态,性能卓越
    主流模型全覆盖:集成Llama、Baichuan、Yi、Qwen、DeepSeek等99%业界SOTA开源模型,预适配昇腾算力底座,精度与推理性能显著提升。
    零代码自动化开发:沉淀100+行业调优经验,提供一键训练、自动超参优化、标准化流水线,无需手动调参,开发周期缩短50%+。
    昇腾深度优化:基于昇腾算子与显存优化技术,训练/推理效率大幅提升,预置最优超参配置,开箱即用。

  2. 资源灵活可控,成本优化
    💡 按需付费,弹性扩缩:分钟级获取算力资源,按实际使用收费,避免闲置浪费,降低AI入门门槛。
    💡 高可用性保障:多数据中心部署,支持故障快速恢复(快恢)断点续训,确保训练任务不中断,保护项目连续性。

  3. 智能应用快速构建
    🤖 Agent开发加速器:提供优质Prompt模板与智能Agent沉淀,支持复杂任务拆解(如多系统协同决策),快速生成业务专属智能体。
    🤝 组件化生态集成:即插即用MCP Server、LangChain、RAG、Guard等工具,一站式构建智能问答、知识管理、流程自动化等应用。

  4. 一站式全生命周期服务
    📦 全流程工具链:覆盖模型调优、压缩、部署、评测等环节,支持「即开即用」,无需跨平台切换。
    ⚙️ 标准化流水线:内置性能与精度评价体系,自动化完成模型优化,确保全场景高性能表现。

1.3 ModelArts Studio使用场景

  1. 行业大模型定制开发
    🔹 金融/医疗/制造:基于开源模型微调,快速构建风控分析、智能诊断、供应链优化等垂直领域大模型。
    🔹 优势:无需从头训练,依托昇腾优化提升行业数据适配性,降低定制成本。

  2. 复杂业务流程自动化
    🔹 企业级决策支持:拆解项目级任务(如跨部门协作、多系统调用),通过智能Agent实现自动化决策与执行。
    🔹 典型场景:智能客服(多轮对话+知识库检索)、工单自动化处理、数据分析报告生成。

  3. 低成本AI创新探索
    🔹 中小企业/初创团队:通过按需付费模式,零门槛试用大模型能力,快速验证业务场景(如营销文案生成、智能质检)。
    🔹 优势:分钟级启动开发,无需预置算力资源,试错成本降低80%。

  4. 高性能实时推理场景
    🔹 实时交互应用:智能问答、推荐系统、工业实时监控等,依托昇腾优化保障低延迟、高并发推理。
    🔹 技术支撑:多数据中心容灾架构,确保7×24小时稳定服务。

  5. 多模态应用集成
    🔹 智能内容生成:结合RAG(检索增强生成)与Guard(安全防护),构建企业级知识中台、数字人交互等多模态应用。
    🔹 组件化优势:快速集成LangChain等工具,实现「数据-模型-应用」闭环。

1.4 ModelArts Studio产品架构

华为云ModelArts Studio产品架构集成了模型服务、应用服务和资源管理等多个模块,支持从模型调优、压缩到部署的全生命周期管理,并提供丰富的插件和应用体验。其底层依托于ModelArts Standard平台,涵盖模型开发、数据工程、训练和推理等核心功能,确保高效灵活的AI开发流程。通过统一资源调度和AI专属资源池,ModelArts Studio实现了资源的按需使用和快速扩展,助力企业轻松应对复杂多变的业务需求。

在这里插入图片描述

二、访问ModelArts Studio大模型即服务平台

2.1 登录华为云

华为云官网:https://www.huaweicloud.com/,在电脑浏览器打开华为云官网后,点击“登录”选项,输入自己的华为云账号和密码,登录华为云官网。

在这里插入图片描述

2.2 进入ModelArts Studio介绍页

在华为云首页的产品——查看所有产品,搜索框内输入ModelArts Studio,即可看到ModelArts Studio大模型即服务平台,点击进去即可。

在这里插入图片描述

同时,可以直接输入ModelArts Studio的地址:https://www.huaweicloud.com/product/modelarts/studio.html,进入ModelArts Studio的介绍页。

在这里插入图片描述

2.3 进入ModelArts Studio控制台

在ModelArts Studio介绍页中,我们点击“ModelArts Studio控制台”。

在这里插入图片描述

刚开始进入时,会提示我们勾选“ModelArts Studio服务声明”,勾选后,选择“确定”选项即可。

在这里插入图片描述

2.4 配置ModelArts委托授权

在ModelArts Studio控制台首页中,在页面上方我们看到依赖服务的授权提醒,我们按照提示点击“此处”,配置相关授权即可。

在这里插入图片描述

快速添加授权:选择新增委托,权限配置则选择普通模式。将服务列表全选后,选择创建即可。

在这里插入图片描述

回到ModelArts Studio控制台首页后,可以看到授权提示已经消失。

在这里插入图片描述

2.5 华为云账号充值

为避免测试过程中出现部署失败等问题,请确保自己的华为云账号余额充足,建议保持账户余额大于10元。

  • 华为云充值地址:https://account.huaweicloud.com/usercenter/?region=cn-north-4&locale=zh-cn#/userindex/allview

在这里插入图片描述

三、开通DeepSeek-V3/R1商用服务

3.1 预置服务介绍

在ModelArts Studio控制台首页中。我们依次选择模型推理—在线推理——预置服务,可以看到商用服务和免费服务列表。预置服务为平台已部署好的服务,无等待时间,按token计费、适合快速测试

在这里插入图片描述

  • 服务类型与计费规则
类别描述说明
服务类型免费服务 / 商用服务
免费服务- 仅限用于模型体验
- 受严格的速率限制
- 平台可能不定期调整支持的模型、免费额度及有效期等信息
商用服务- 提供商用级别的推理 API 服务
- 开通后可获取付费 API 使用权限
  • 推理额度与使用方式
项目说明
免费额度单个模型提供 200万 token 推理额度
额度耗尽后处理方式- 可开通商用级别推理 API(仅限区域:贵阳一)
- 或前往“我的服务”部署为自定义服务后按需付费使用
优惠折扣相关信息有关模型服务的优惠折扣发放与使用情况,请前往 费用中心查看

备注:如果需了解更多详情,建议访问华为云官方文档或费用中心页面。

3.2 开通商用服务DeepSeek-V3-32K

我们选择开通商用服务DeepSeek-V3-32K,其专注于内容生成、代码辅助与多轮对话,在长文本处理与逻辑连贯性方面表现出色。

在这里插入图片描述

注意保证华为云账户余额充足,确认开通DeepSeek-V3-32K服务。

在这里插入图片描述

查看DeepSeek-V3-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

3.3 开通商用服务DeepSeek-R1-32K

我们选择开通商用服务DeepSeek-R1-32K,它聚焦于检索增强生成(RAG),适用于企业知识库问答、文档分析等强调准确性和可溯源性的场景。

在这里插入图片描述

查看DeepSeek-R1-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

四、商用服务DeepSeek-V3/R1对比

  • 📊 模型功能与适用场景对比
对比维度DeepSeek-V3-32KDeepSeek-R1-32K
核心能力内容创作、代码生成、多轮对话、逻辑推理检索增强生成(RAG)、知识库问答、文档分析
输入价格¥0.002 / 千 tokens¥0.004 / 千 tokens
输出价格¥0.008 / 千 tokens¥0.016 / 千 tokens
典型应用场景技术文档撰写、自动化内容生成、智能客服、编程辅助企业内部知识库查询、法律/金融文档解析、精准问答服务
响应速度快速响应,适合实时交互略慢(因涉及外部数据检索),但准确性高
优势特点结构清晰、逻辑连贯、长文本记忆能力强可溯源、精准回答、支持超长文本(如100K+)处理
局限性对实时性知识依赖训练数据,可能存在滞后响应时间较长,不适合极高时效性要求的场景

✅ 使用建议总结

  • 如果业务侧重于内容生成、代码编写或对话理解,推荐使用 DeepSeek-V3-32K,性价比高且响应迅速。
  • 如果应用更注重知识检索、答案可追溯性及超长文本处理,例如在企业知识库、法律合同分析等场景中,DeepSeek-R1-32K 更为合适。

💡 提示:结合具体业务需求测试两种模型的实际表现,将有助于选择最优方案。

五、商用服务DeepSeek-V3/R1在线体验

5.1 DeepSeek-V3-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-V3-32K的在线体验选项。

在这里插入图片描述

在DeepSeek-V3-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

我们让DeepSeek-V3-32K编写一段以端午节祝福为主题的简单静态 HTML 网页代码。

  • 我们在对话框内,输入以下提示词:
请生成一段简单且美观的静态 HTML 代码,用于展示一个以 “端午节祝福” 为主题的网页。具体要求如下:
页面整体风格温馨、传统,体现浓厚的节日气氛;
使用柔和的中国传统色系(如红色、金色、浅绿、粽叶绿等);
包含标题(如“端午安康,粽情祝福!”)、正文祝福语、背景图片或图案(可使用CSS模拟背景图或渐变);
添加字体动画或淡入效果,使页面更具观赏性;
使用 Google 字体(如 "Noto Serif CJK""Ma Shan Zheng" 等书法/手写字体)提升美感;
不使用外部 JS 和图片资源,所有样式通过内联 CSS 实现;
页面适配移动端,结构简洁,加载快速。

在这里插入图片描述

将生成的代码保存到本地电脑并命名为 .html 文件后,用浏览器打开即可查看页面效果,整体呈现非常美观、节日氛围浓厚。

在这里插入图片描述

5.2 DeepSeek-R1-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-R1-32K的在线体验选项。

在这里插入图片描述

在 DeepSeek-R1-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

在DeepSeek-R1-32K对话框内,要求也一首现代诗,要求赞美夏天,要求质量高。给出的提示词如下所示:

请以“夏天”为主题,创作一首现代诗。要求如下:语言优美,富有画面感和情感表达;
运用丰富的意象,如阳光、蝉鸣、荷花、雷雨、西瓜、微风等元素;
表达对夏天的喜爱与赞美,可融入自然之美、生命之力或时光之美的描写;
结构清晰,段落之间有节奏感和层次感;
风格清新自然或深沉热烈均可,避免陈词滥调,追求诗意创新。

生成的现代诗效果如下,整体质量还是令人非常满意得。

在这里插入图片描述

5.3 DeepSeek-V3/R1调用统计功能

ModelArts Studio 平台(MaaS服务)为 DeepSeek-V3 和 R1 模型提供了调用统计功能,可实时监控并记录模型服务的使用情况。 目前,调用统计数据仅针对通过 API 接口调用 产生的请求进行统计,页面体验等前端操作所触发的调用暂未纳入统计范围。

在这里插入图片描述

六、使用体验与总结

🌟 使用体验

在本次部署 DeepSeek-V3 与 DeepSeek-R1 商用服务的过程中,ModelArts Studio 展现出极高的易用性与稳定性。平台界面清晰直观,操作流程简洁流畅,即使是首次使用也能快速上手。从模型选择、服务开通到API调用,每一步都提供了详细的指引和实时反馈,极大提升了部署效率。整体体验下来,不仅感受到华为云在AI工程化落地方面的深厚技术积累,也对企业级AI服务平台的成熟度有了更深认知。

📈 总结展望

ModelArts Studio 凭借其强大的功能集成和灵活的资源调度能力,为企业大模型应用提供了坚实的技术底座。通过本次实践,我们验证了其在实际业务场景中的高效支持能力,特别是在模型性能、计费透明和调用监控方面的表现尤为突出。未来,随着更多大模型的接入和功能的持续优化,ModelArts Studio 将成为推动企业智能化转型的重要引擎。相信在华为云的持续赋能下,AI技术将更加快速、深入地融入各行各业的发展之中。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/bicheng/82895.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

易经六十四卦象解释数据集分享!智能体知识库收集~

今天给大家分享一个易经六十四卦象解释数据集 ,继续来积累AI相关的资料。 六十四卦,记载于《易经》,每一卦的图像均由两个八卦上下组合而成,每一卦各有六个爻。南宋朱熹说,先画八卦于内,后画八卦于外&#…

1 µs = 10⁻⁶ s

1 s 10⁰ s 1 ms 10⁻ s 1 s 10⁻⁶ s 1 ns 10⁻⁹ s 1 ps 10⁻ s 1 fs 10⁻⁵ s ⏱️ 时间单位(十进制) 符号单位名称10 的幂次s秒(second)10⁰ms毫秒(millisecond)10⁻s微秒(microseco…

webrtc初了解

1. webrtc的简介 一、WebRTC 是什么? Web Real-Time Communication(网页实时通信),是浏览器原生支持的实时音视频通信技术,无需安装插件或客户端,可直接在浏览器之间实现点对点(P2P&#xff09…

从数据持久化到网络通信与OpenCV:Qt应用程序开发的深度探索与实战

文章目录 前言一、QSettings:轻量级数据持久化方案1.1 QSettings 主要特点1.2 QSettings 常用函数整理 二、数据库2.1 连接SQLite数据库2.2 建表2.3 增删改 三、网络编程3.1 网络分层3.2 IP地址3.3 端口号3.4 基于TCP的Socket通信3.4 相关接口3.4.1核心类3.4.2 通信…

经典SQL查询问题的练习第一天

首先有三张表,学生表、课程表、成绩表 student:studentId,studentName; course:courseId,courseName,teacher; score:score,studentId,courseId; 接着有以下几道题目: ①查询课程编号为‘0006’的总成绩: 首先总成绩&#x…

企业级网络管理实战:Linux、云与容器的深度融合与优化

在数字化转型浪潮下,企业网络架构日益复杂,Linux系统、云计算与容器技术成为构建高效、灵活网络的核心要素。本文将从技术原理、实践方案、优化策略三个维度,深度解析企业级网络管理中的关键技术,助力企业打造稳定、安全、可扩展的…

信号与系统速成-1.绪论

b站浙大教授虽然讲的比较细,但是太慢了,不适合速成 祖师爷奥本海姆的MIT课程好像和我们教材的版本不太匹配,但是讲的很不错 慕课上也有很多资源,比如信号与系统 - 网易云课堂 同站博主篱笆外的xixi的文章也挺不错 最终我还是选…

缓存架构方案:Caffeine + Redis 双层缓存架构深度解析

在高并发、低延迟的现代互联网系统中,缓存是提升系统性能和稳定性的重要手段。随着业务复杂度的增长,单一缓存方案(如仅使用Redis或仅使用本地缓存)已难以满足高性能与一致性需求。 本文将围绕 Caffeine Redis 的双层缓存架构展…

【Elasticsearch】track_total_hits

在 Elasticsearch 中,track_total_hits 是一个查询参数,用于控制是否精确计算搜索结果的总命中数(total hits)。默认情况下,Elasticsearch 在某些情况下可能会对总命中数进行近似计算,以提高性能。track_to…

智能手机上用Termux安装php+Nginx

Termux的官方网站:Termux | The main termux site and help pages. 以下是在 Termux 上安装和配置 PHP Nginx 的完整流程总结,包含关键步骤和命令: 一、安装依赖 pkg update && pkg upgrade # 更新包列表和系统pkg install nginx p…

电脑开机后出现bootmgr is conmpressed原因及解决方法

最近有网友问我为什么我电脑开机后出现BOOTMGR is compressed,这个提示意思是:意思是启动管理器被压缩了,即使重启也无法正常进入系统。原因有很多,大部分是引导出现问题,或选错了启动硬盘所导致的,下面我们来详细分析…

服务发现Nacos

目录 Nacos server 安装 注册服务到Nacos server 接口访问Nacos server中的已注册服务 Nacos控制台介绍 Nacos:一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。 在分布式服务应用中,各类服务需要统一的注册、统一的管理,这个组件工具…

并查集 c++函数的值传递和引用传递 晴神问

目录 学校的班级个数 手推7个班级,答案17?怀疑人生 破案了,应该是6个班。 破案了,原来写的是 unionxy(a, b, father); c if两个数同时为正或为负 简洁写法 可以用位运算? c可以这样赋值吗?ab2 典型…

Qt Creator快捷键合集

前言 QtCreator是一款跨平台的IDE,专为Qt开发设计,支持C/C++/JS/Python编程,支持设备远程调试,支持代码高亮,集成帮助文档,原生支持cmake和git,确实是一款朴实而又强大的集成开发环境,让人有种爱不释手的感觉 编辑 功能快捷键复制Ctrl + C粘贴Ctrl + V剪切Ctrl + X代…

docker网络相关内容详解

一、docker与k8s 一、Docker 核心解析 1. Docker 定义与架构 本质: 容器化平台(构建容器化应用)、进程管理软件(守护进程管理容器生命周期)。客户端(docker cli)与服务端(docker ser…

首发!PPIO派欧云上线DeepSeek-R1-0528-Qwen3-8B蒸馏模型

首发!PPIO派欧云上线DeepSeek-R1-0528-Qwen3-8B蒸馏模型 DeepSeek R1 系列的模型更新还在继续。 继昨天 PPIO派欧云首发上线 DeepSeek-R1-0528 模型后,今天 PPIO 再次首发 DeepSeek 最新开源的蒸馏模型 DeepSeek-R1-0528-Qwen3-8B。 DeepSeek-R1-0528-Q…

如何用命令行将 PDF 表格转换为 HTML 表格

本文将介绍如何使用命令行将可填写的 PDF 表单转换为 HTML 表单。只需几行代码即可完成转换。将可填写的 PDF 表单转换为 HTML 表单后,你可以在网页上显示这些表单。本指南使用 FormVu 来演示转换过程。 使用命令行将可填写 PDF 表单转换为 HTML 表单 你可以通过命…

杰发科技AC7840——CSE硬件加密模块使用(2)

注意: 不要随便修改主秘钥,本次跑代码过程中,对主秘钥进行修改,导致无法对cse模块恢复出厂设置 更新秘钥例程 第2个例程主要是把cse的key加载到cse安全区域中 这里刚看到加载秘钥并不是直接把明文加载到cse模块 测试第3个例程 复…

浅解Vue 数据可视化开发建议与速度优化

数据可视化在现代前端应用中至关重要,但处理大规模数据时容易遇到性能瓶颈。以下是针对 Vue 项目的个人看法的优化方案: 文章目录 一、框架选型建议二、大数据渲染优化三、渲染性能提升四、内存管理五、监控与调试六、进阶优化方案七、Vue特定优化八、构…

lua脚本学习笔记1:Vscode添加lua环境_lua基本语法

下载Lua环境,lua语言基本语法。 目录 lua介绍: VsCode添加Lua编程环境 下载Lua 配置环境变量 查询lua环境 打开 VSCode,安装 Lua 语言插件和调试器 VScode增添lua编译器路径 测试lua程序: 代码: 结果: 参考…