啥时候上RAG?啥时候上微调?丨实战笔记

哈喽,大家好👏

我是阿星!

现在很多AI科普文章都会提到微调,RAG。

但是没有实战的过的同学可能会问🤔——

啥时候用RAG?啥时候用微调呢?有啥区别?不都是让模型增加知识面的吗?

今天我们就对这个问题进行粗略归类——

关于微调

你可以简单理解为在预训练之后(预训练你可以简单理解成自监督学习,得到一堆参数但是还不会自己回答)

——进行的一些QA对训练,来教会模型组织语言,回答问题。

但是要注意微调是没有对知识样本做扩充的,扩充还是通过预训练完成的。

微调之后才是基于人类反馈的强化学习。

简单说就是预训练👉微调👉强化学习,微调是中间这个环节。

不同微调之间有啥区别?

1、继续预训练-CPT:来增加知识、能力。补充模型在特定领域的缺陷。

2、微调训练-SFT:给模型更多的QA对,来增强模型的依从性。常用于垂直大模型。这是现在最主要的方式。

3、偏好调优-DPO:用负反馈优化输出,让模型知道不能干啥,啥是错的。

但是没事也不用微调,不要听到别人说微调自己也想微调……有很多已经调好的,可以去百炼云上看😂我之前也写了一篇可以体验简版流程,实际比这个难n倍。零基础也能体验模型微调!魔塔+LLaMa Factory手把手教程

没有必要,千万别微调

优先级可以按照提示词大于RAG大于微调。

1、针对特定行业/领域,如果模型根本就不具备特定知识,你可以用继续预训练-CPT。只不过数据上很多是1500万字起步(下一篇推送会讲讲微调的数据质量要求有多可怕)

2、针对特定问题,微调训练-SFT可以用RAG、提示词、示例来做一些代替。因为SFT对数据质量要求要比RAG高,可以选择不那么折腾直接上RAG

3、至于偏好调优-DPO,你可以选择用提示词示例。因为错误答案本身就对数据的要求更多了。你要枚举多少回答来让模型记住啥是错的?

啥时候必须上微调

再好的提示词都有输出上的出入,如果是垂直指定的问题,你要求它回答的丁是丁卯是卯,那还是用微调最好。特别是金融和医疗。

1、比如在履职问题测评中,你需要对问题做严格分类,查询特定的数据库,也可能涉及到指定的关键词。说白了就是场景足够垂直。

2、高并发任务、对效率要求极高的场景,可以通过微调加速响应。

比如对即时主观题打分,就会需要快速响应来适应考试节奏等。

3、特别是端侧,很多服务都需要云端判断,对定向场景需要的就是速度和准确度,离不开微调。

下一期我们详细说说微调有多麻烦。我是阿星,我们下期再见。

往期文章:

一键榨干视频干货!这个开源神器让90%知识博主慌了

普通提示词vs工程级提示词,掌握这4点

超酷!苹果最新开源摄像头会看的AI,fastvlm视觉模型真机实测

n8n教程:5分钟部署+自动生AI日报并写入飞书多维表格

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/912736.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/912736.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RabbitMQ-基础篇

前言: 今天开始学RabbitMQ,还是跟着黑马的课程。 今日所学: RabbitMQ介绍RabbitMQ入门Java客户端中的MQ 1.RabbitMQ介绍 1.1 什么是RabbitMQ RabbitMQ 是一个开源的消息代理软件(消息队列中间件),实现了高级消息…

docker-compose配置redis哨兵详细步骤和配置文件

docker-compose配置redis哨兵详细步骤和配置文件 目录结构调整 redis-cluster/ ├── config/ │ ├── master.conf # 主节点配置 │ ├── slave1.conf # 从节点1配置 │ ├── slave2.conf # 从节点2配置 │ ├── sentinel1.…

多模态大语言模型arxiv论文略读(146)

Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios ➡️ 论文标题:Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios ➡️ 论文作者:Yunkai Dang, Mengxi G…

【教程】Linux中限制用户可以使用的GPU数量 | 附脚本

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~ 目录 背景说明 设置方法 管理脚本 进阶限制 恢复默认组 注意事项 背景说明 比较简单的方式是使用group来管理权限,这种方式能限制哪些…

90.xilinx复位低电平(一般使用低电平复位)

Xilinx FPGA 中的寄存器(Flip-Flop)**确实支持异步复位**,但具体实现方式取决于你使用的设计方法(HDL 代码风格或原语实例化)。以下是详细说明: --- ### 1. **Xilinx 寄存器的复位特性** - **同步复位…

NVMe高速传输之摆脱XDMA设计10: DMA 控制单元设计

DMA 控制单元负责控制 DMA 传输事务, 该单元承担了 DMA 事务到 NVMe 事务的转换任务, 使用户对数据传输事务的控制更加简单快捷。 DMA 控制功能由 DMA寄存器组实现。 DMA 寄存器组包含 DMA 操作寄存器、 DMA 长度寄存器、 DMA 源目的地址寄存器和 DMA 状…

如何设置电脑定时休眠?操作指南详解

长时间运行电脑会导致硬件过热,缩短其使用寿命。定时关机有助于让硬件得到休息,降低因长时间高负荷工作导致损坏的风险。 它的界面简洁直观,功能却十分实用,涵盖了定时关机、重启、注销、休眠、待机以及锁定等多种操作。 以设置“…

LeetCode[617]合并二叉树

思路: 我们合并左右子树,在递归左右子树的时候,一定要保证左右子树不为空,如果左子树为空,那么直接返回右子树就行了,即使右子树为空。如果右子树为空那么直接返回左子树就行了,这样判断完就正常…

Redis 常用五大数据类型

1、Redis 关键字(Key) keys * 查看当前库所有keyexists [key] 判断某个key是否存在type [key] 查看当前key的数据类型del [key] 删除指定的key数据unlink [key] 根据value选择非阻塞删除,仅将keys从keyspace元数据中删除,真正的删…

大语言模型(LLM)专业术语汇总

1. 训练与部署 1.1 预训练 专业:在海量无标注文本(如Common Crawl、Wikipedia)上通过自监督学习训练基础语言模型,学习通用语言表征(如GPT-3训练数据达45TB)。通俗:AI的“通识教育阶段”&…

【Java Swing 图形界面编程】JList 列表组件 ① ( JList 组件简介 | 核心作用 | 关键特性 | 基础用法示例 )

文章目录 一、JList 组件简介1、JList 概念简介2、JList 核心作用3、JList 关键特性 二、JList 组件基础用法示例1、使用 String 数组构建列表项2、使用 Vector 集合构建列表项3、使用 DefaultListModel 构建列表项 一、JList 组件简介 1、JList 概念简介 基本概念 : JList 组件…

【小技巧】Python+PyCharm IDE 配置解释器出错,环境配置不完整或不兼容。(小智AI、MCP、聚合数据、实时新闻查询、NBA赛事查询)

报错信息如下: [unsupported] Python 3.1 (mcp-calculator-main) (3) C:\Users(xsshu\AppData\Local\Programs\Python\Python313\python.exe [unsupported] Python 3.1 C:\Users\xsshu\AppData\Local\Programs\Python\Python311\python.exe 这条输出显示了两个 Pyth…

Ragflow 前后端登录逻辑

前端登录逻辑 路由配置: /login 路由指向 /pages/login 组件。登录表单使用 Ant Design 的 Form, Input, 和 Button 组件。 登录表单处理: 使用 useLogin钩子来处理登录请求。密码通过 RSA 加密后再发送到服务器。成功登录后导航至 /knowledge 页面。 …

基于图神经网络的ALS候选药物预测模型设计与实现

基于图神经网络的ALS候选药物预测模型设计与实现 一、任务背景与意义 肌萎缩侧索硬化症(ALS)是一种致命的神经退行性疾病,目前尚无有效治愈方法。传统药物发现流程耗时长、成本高,而人工智能技术为加速药物发现提供了新途径。本文设计并实现了一个基于图神经网络(GNN)的…

运维打铁: 数据加密与备份恢复策略制定

文章目录 思维导图一、数据加密1. 加密算法选择AES 加密示例(Python)RSA 加密示例(Python) 2. 密钥管理3. 加密范围 二、数据备份1. 备份类型全量备份增量备份差异备份 2. 备份频率3. 备份存储位置 三、数据恢复1. 恢复测试2. 恢复…

AIbase MCP服务库上线:集成服务器、客户端、案例教程等服务

在当今数字化时代,人工智能技术正以前所未有的速度发展,深刻地改变着我们的生活和工作方式。而要充分发挥AI的强大能力,离不开高效的工具和服务支持。今天,就让我们来了解一下一个专注于MCP(Model Context Protocol&am…

QGIS+CesiumIon

前言 QGIS 3.44中,新增了3D 场景新增地球视图模式,通过Cesium ion插件,支持谷歌全球倾斜模型的加载显示。 目录 1 CesiumIon插件安装 2 加载谷歌全球倾斜模型 1、CesiumIon插件安装 点击菜单【Plugins】->【Manage and Install Plugins】…

TEXT Introduction

我们是谁 美国计算机奥林匹克竞赛通过培训、竞赛和国际比赛来促进大学前的计算机学习。 数个教练将会组织、领导、陪伴代表美国参加国际性奥林匹克竞赛的学生。 你可以在 USACO 官网了解更多。 USACO 的目标 USACO 的具体目标包括: 训练美国的队伍并且在下一届奥…

Fluent许可服务器设置教程

Fluent作为一款广泛使用的流体动力学模拟软件,其高效的许可管理系统是确保顺畅运行的关键。为了帮助您更好地掌握Fluent许可服务器的设置方法,本文将为您提供一份详细的设置教程,让您轻松配置,高效运行Fluent软件。 一、Fluent许可…

vue3中实现高德地图POI搜索(附源码)

引言 上一篇文章详细讲解了vue3中实现高德地图地址搜索自动提示(附源码)🔗,本文将重点介绍POI搜索功能的实现。 1. 功能介绍 POI(Point of Interest) 搜索用于查找特定位置或区域内的兴趣点,如餐馆、商场、景点等。…