昇思学习营-DeepSeek-R1-Distill-Qwen-1.5B 模型LoRA微调学习心得

昇思学习营-DeepSeek-R1-Distill-Qwen-1.5B 模型LoRA微调学习心得

news/2025/7/27 21:46:11/文章来源:https://blog.csdn.net/u014556926/article/details/149670222

LoRA微调：加入参数式微调

冻结原始网络参数，对Attention层中QKV等添加旁支，包含两个低维度的矩阵A和矩阵B，微调过程中仅更新A、B 矩阵

效果：训练参数被大幅降低，资源消耗较低。

对attention的参数加入如下图所示，使用两个A，B矩阵来拟合原始QKV矩阵，其中A，B矩阵中的两个参数r,lora_alpha为重要参数，一般情况下，lora_alpha为r的两倍以上。

Mindspore中的实现代码如下图所示：

整体流程代码部分：

数据导入和载入分词模型及配置：

\

数据样式：

数据处理逻辑部分：

训练模型参数及配置载入：

训练参数及配置：

香橙派板子上运行模型优化策略：

香橙派AIpro的host侧和device侧共享，所以在host侧的内存占用（如python的多进程，模型加载等）也会影响到显存。

优化策略：

1. 在加载模型时，直接加载fp16的权重，而非加载fp32权重再转成fp16。

2.如何限制拉起的python进程数，从而控制额外的内存占用，减少对显存的影响

3.在开启新的终端时，手动限制进程最大内存占用，开了swap然后再限制内存就可以空出来给NPU用。

学习心得：

了解lora模型训练基础原理
对mindspore上进行模型微调的代码进行分析和确认，方便后续代码的升级和维护
对香橙派板子上进行微调的具体流程，包含数据预处理、模型参数及配置加载、训练参数和保存等。
对香橙派板子上运行的模型优化策略有一定了解，例如权重加载、限制进程数、限制内存等。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/news/916368.shtml
繁体地址，请注明出处：http://hk.pswp.cn/news/916368.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

彩色转灰度的核心逻辑：三种经典方法及原理对比

彩色转灰度的核心逻辑：三种经典方法及原理对比

灰度实验将彩色图像转换为灰度图像的过程称为灰度化，这种做法在图像处理和计算机视觉领域非常常见。灰度图与彩色图最大的不同就是：彩色图是由R、G、B三个通道组成，而灰度图只有一个通道，也称为单通道图像，所以彩色图转…

阅读更多...

Spring Boot 项目启动自动执行逻辑的最佳实践：掌握 CommandLineRunner

Spring Boot 项目启动自动执行逻辑的最佳实践：掌握 CommandLineRunner

前言 Spring Boot 启动阶段，总有些操作迫不及待冲在前线：配置要加载，数据要准备，日志要抢首发，仿佛个个争当“启动 MVP”。如果你也想让项目一启动就自动开工，少写点手动触发的“苦力逻辑”，那 CommandLineRunner 就是你的得力助手。它像那个永远第一个打卡的同事，不喝…

阅读更多...

高可用集群KEEPALIVED的详细部署

高可用集群KEEPALIVED的详细部署

一.高可用集群 1.1 集群类型 LB：Load Balance 负载均衡 LVS/HAProxy/nginx（http/upstream, stream/upstream） HA：High Availability 高可用集群数据库、Redis SPoF: Single Point of Failure，解决单点故障 HPC&#x…

阅读更多...

[论文阅读] 人工智能 + 软件工程 | NoCode-bench：评估LLM无代码功能添加能力的新基准

[论文阅读] 人工智能 + 软件工程 | NoCode-bench：评估LLM无代码功能添加能力的新基准

NoCode-bench：评估LLM无代码功能添加能力的新基准论文：NoCode-bench: A Benchmark for Evaluating Natural Language-Driven Feature Addition 研究背景：当AI尝试给软件"加新功能"，我们需要一张靠谱的"考卷"…

阅读更多...

【Git知识】Git 常用知识集合之基础--分支系统与 Tag 标签机制

【Git知识】Git 常用知识集合之基础--分支系统与 Tag 标签机制

🧰 Git 常用知识集合Git 是程序员的“时间机器”。这份手册帮你从入门到精通，把 Git 玩明白。1️⃣ Git 基础操作流程 📌 三步走流程：添加 → 提交 → 推送 git add . # 把所有修改加入暂存区 git commit -m …

阅读更多...

深入解析 Spark：关键问题与答案汇总

深入解析 Spark：关键问题与答案汇总

在大数据处理领域，Spark 凭借其高效的计算能力和丰富的功能，成为了众多开发者和企业的首选框架。然而，在使用 Spark 的过程中，我们会遇到各种各样的问题，从性能优化到算子使用等。本文将围绕 Spark 的一些核心问题进行…

阅读更多...

Python-初学openCV——对openCV的简单使用

Python-初学openCV——对openCV的简单使用

一、概述1、简单介绍OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉库，旨在为实时图像处理提供强大的功能。它由Intel开发，现由开源社区维护。OpenCV 提供了跨平台的解决方案，支持 Windows、Linu…

阅读更多...

去中心化时代的通信革命：briefing与cpolar技术融合带来的安全范式革新

去中心化时代的通信革命：briefing与cpolar技术融合带来的安全范式革新

文章目录前言1.关于briefing2.本地部署briefing3.使用briefing4.cpolar内网穿透工具安装5.创建远程连接公网地址6.固定briefing公网地址前言数字协作本该是提升效率的过程，却被这些数据管理问题不断困扰：平台条款中的监控声明、跨网络环境的接入障碍、…

阅读更多...

GitHub新手生存指南：AI项目版本控制与协作实战

GitHub新手生存指南：AI项目版本控制与协作实战

点击 “AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。代码仓库创建分支管理 PR提交开源项目复现读者收获：掌握团队开发必备技能…

阅读更多...

Axios封装以及添加拦截器

Axios封装以及添加拦截器

在前端开发中，http请求层的封装可以极大提升代码的复用性和可维护性，本文将完整的用axios封装接口请求，配置请求与响应拦截器，封装统一的请求方法全过程。封装的目的和思路在项目直接用axios发送请求当然没问题，但是如…

阅读更多...

C语言中奇技淫巧04-仅对指定函数启用编译优化

C语言中奇技淫巧04-仅对指定函数启用编译优化

相信很多人使用GCC编译代码时，都会接触到gcc -O0/1/2/3/s，知道它可以对工程进行全局优化。事实上，除了全局优化外，使用GCC扩展方式，我们还可以仅对部分关键函数实施差异化编译优化。在GCC编译器中，attrib…

阅读更多...

HTML Style 对象深度解析：从基础到高级应用

HTML Style 对象深度解析：从基础到高级应用

一、Style 对象的核心概念定义与作用 Style 对象是 HTML DOM 中用于操作元素内联样式的接口，通过 element.style 访问。它允许动态修改元素的 CSS 属性，但仅能直接影响内联样式（即通过 style 属性直接写在标签中的样式）。与外部样…

阅读更多...

【C++】定义常量

【C++】定义常量

在 C 中，有两种简单的定义常量的方式： 使用 #define 预处理器。使用 const 关键字。 #define 预处理器 #include <iostream> using namespace std;#define LENGTH 10 #define WIDTH 5 #define NEWLINE \nint main() {int area; area LENGTH …

阅读更多...

基于遗传算法的多无人车协同侦察与安全保护策略优化

基于遗传算法的多无人车协同侦察与安全保护策略优化

基于遗传算法的多无人车协同侦察与安全保护策略优化前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。 1. 引言 1.1 研究背景与意义随着无人系统技术的快速发…

阅读更多...

python面向对象编程详解

python面向对象编程详解

面向对象编程（OOP）是一种以对象为核心的编程范式。Python全面支持OOP，主要包含以下核心概念：一、类与对象1.类(Class)类是创建对象的模板或蓝图，它定义了对象的属性和方法。class Dog:# 类属性（所有实例共享…

阅读更多...

快速入门Socket编程——封装一套便捷的Socket编程——导论

快速入门Socket编程——封装一套便捷的Socket编程——导论

快速入门Socket编程——封装一套便捷的Socket编程——导论前言这里是笔者打算做的Socket编程的第二部分，也就是核心的讨论我们Socket编程本身。导论我们知道，一个经典的服务器套接字的处理流程是如下的： 创建一个指定传输层和网络层…

阅读更多...

【Mermaid 离线工具】Mermaid 流程图生成器 - 高清PNG输出，一键生成专业级流程图！

【Mermaid 离线工具】Mermaid 流程图生成器 - 高清PNG输出，一键生成专业级流程图！

文章目录 Mermaid 流程图生成器（离线版本）：高效绘图，离线也能玩转专业可视化一、Mermaid：文本绘图的 “魔法语法” 二、离线版生成器：功能与优势解析（一）离线可用，场景更灵活（二）操作流程：简单五步，产出专业图表（三）界面设计：简洁直观，降低使用门槛三、应…

阅读更多...

haproxy原理及实战部署

haproxy原理及实战部署

一、负载均衡负载均衡是网络架构和分布式系统中至关重要的技术，其核心作用是将大量的并发请求或数据流量合理分配到多个服务器（或其他资源节点）上，从而解决单节点压力过大、资源利用率低、系统稳定性差等问题。作用1. 提高系统吞…

阅读更多...

jwt 在net9.0中做身份认证

jwt 在net9.0中做身份认证

一、新建net9.0项目WebApplication1，安装包 <ItemGroup><PackageReference Include"Microsoft.AspNetCore.Authentication.JwtBearer" Version"9.0.7" /><PackageReference Include"Swashbuckle.AspNetCore" Version&…

阅读更多...

【机器学习深度学习】微调能改变模型“智商”吗？——模型能力与知识的本质解析

【机器学习深度学习】微调能改变模型“智商”吗？——模型能力与知识的本质解析

目录前言一、模型的“知识”与“能力”：两种不同的智能第一种：浅层知识（记忆模式识别） 第二种：深层能力（推理理解） 二、微调：改变的是“经历”，不是“天赋”…

阅读更多...

最新文章