【RAG】RAG综述|一文了解RAG|从零开始(下)

文章目录

  • 5. RAG的架构
    • 5.1 Naive RAG
    • 5.2 Advanced RAG
      • 5.2.1 检索前处理和数据索引技术
      • 5.2.2 知识分片技术
      • 5.2.3 分层索引
      • 5.2.4 检索技术
        • 5.2.4.1 优化用户查询
        • 5.2.4.2 通过假想文档嵌入修复查询和文档不对称
        • 5.2.4.3 Routing
        • 5.2.4.5 自查询检索
        • 5.2.4.6 混合搜索
        • 5.2.4.7 图检索
        • 5.2.4.8 微调嵌入模型
      • 5.2.5 检索后技术
        • 5.2.5.1 通过重新排名确定搜索的优先级
        • 5.2.5.2 使用上下文提示压缩优化搜索结果
        • 5.2.5.3 Corrective RAG
        • 5.2.5.4 扩展查询
      • 5.2.6 生成技术
        • 5.2.6.1 思维链
        • 5.2.6.2 通过 Self-RAG 使系统具备自我反思能力
        • 5.2.6.3 微调LLM
    • 5.3 模块化RAG
      • 5.3.1 模块化RAG系统组成
      • 5.3.2 模块化RAG的工作流程
      • 5.3.3 模块化RAG的优势
      • 5.3.4 模块化RAG的挑战

本篇是 【RAG】RAG综述|一文了解RAG|从零开始(下)的后续,重点讲解RAG的结构与重点技术。

5. RAG的架构

在这里插入图片描述

5.1 Naive RAG

这是最简单的RAG架构,其工作流程为:

  1. 用户查询
  2. 检索信息
  3. 利用prompt技术增强
  4. 将prompt输入到LLM生成结果

5.2 Advanced RAG

相比于朴素RAG,高级RAG主要优化了索引步骤和生成步骤。高级RAG技术提高了信息检索和后续内容生成的效率、准确性和相关性。

高级RAG涉及的主要技术:检索前处理和数据索引技术、知识分片技术、检索技术、后检索技术和生成技术。

5.2.1 检索前处理和数据索引技术

检索前处理侧重在数据进入向量库或知识图谱之前提高数据的质量。干净、格式良好的数据可以提高检索数据的质量,而嘈杂的数据会显著降低检索结果,从而更容易导致LLM幻觉的产生。

预处理数据的常见方法:

  • 增加信息密度:可以通过LLM对查询进行改写,总结、提取或清理后查询信息密度更高。
  • 删除数据中的重复信息:同样能用LLM对查询进行去重,输出LLM更容易理解、更简洁的查询语句。
  • 使用假设问题索引提高索引对称性
    • 使用语言模型为数据库中每个数据块生成一个或多个问题,并将它们与文档块一起存储。这些问题可用于索引。
    • 在检索的时候,用户查询在语义上与模型生成的所有问题匹配。然后索引与用户查询类似的问题,然后将与检索问题关联的文档块传递给LLM以生成响应。

5.2.2 知识分片技术

知识分片就是将大文档分解成较小的文本块,以便更高效的进行检索和生成。这些较小的文本块,称为chunk,它可以是段落,句子,子句或短语,具体取决于实际应用需求。

常见的分片技术有:

  1. 基于文本长度的切块:例如固定300个词或500个字符对文本进行切分。
  2. 滑动窗口技术:这种方法通过在连续的文本块之间使用重叠区域来进行切块,确保每个块都可以包含部分上下文信息。这在需要上下文连贯性的应用中非常有用,比如生成模型需要更大的上下文信息来生成准确的内容。
  3. 基于句子的切块:按句子对文本进行切分,适用于短且结构简单的文档。
  4. 基于语义的切块:可以根据章节、段落、主题或关键字进行切分。这种切分出来的块更具有语义一致性。
  5. 自然语言处理技术:通过分句、分词、主题建模等NLP技术对文本进行切分。好处就是能用NLP技术识别到文本中的语义边界,使得切出来的块更具语义。

关于chunk优化的代码实践:https://blog.csdn.net/2401_85325557/article/details/143359056

5.2.3 分层索引

使用分层索引来提高RAG应用程序的精度。在这种方法中,数据被组织成一个分层结构,信息根据相关性和关系进行分类和子分类。

检索过程从较宽的数据块或父节点开始,然后再链接到所选父节点的较小数据块或子节点中进行更集中的搜索。分层索引不仅可以提高检索效率,还可以最大限度减少最终输出中包含不相关的数据。

在这里插入图片描述
在这里插入图片描述

5.2.4 检索技术

5.2.4.1 优化用户查询

该技术将用户的查询重构为LLM更容易理解且检索器更容易使用的格式。技术实现上可通过微调的语言模型处理用户查询,以优化和构建它。此过程会删除任何不相关的上下文并添加必要的元数据,从而确保查询针对底层数据存储进行定制。

例子:
原始:who was the director of the Godfather?
LLM处理后:(Movice: “The Godfather” …)

5.2.4.2 通过假想文档嵌入修复查询和文档不对称

在这里插入图片描述

假想文档嵌入(HyDE)技术是一个新颖且强大的方法。它通过生成一个假想的文档来增强查询的检索效果,再通过嵌入向量查找与假想文档相似的实际文档,从而实现更高效的检索。

在传统的检索增强生成(RAG)架构中,用户的查询直接用于查找文档。然而,这种方式可能会受到语义偏差的影响,导致检索效果不佳。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/907747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

山东大学软件学院项目实训-基于大模型的模拟面试系统-面试官和面试记录的分享功能(2)

本文记录在发布文章时&#xff0c;可以添加自己创建的面试官和面试记录到文章中这一功能的实现。 前端 首先是在原本的界面的底部添加了两个多选框&#xff08;后期需要美化调整&#xff09; 实现的代码&#xff1a; <el-col style"margin-top: 1rem;"><e…

FPGA纯verilog实现MIPI-DSI视频编码输出,提供工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 MIPI 编解码方案 3、设计思路框架工程设计原理框图FPGA内部彩条RGB数据位宽转换RGB数据缓存MIPI-DSI协议层编码MIPI-DPHY物理层串化MIPI-LVDS显示屏工程…

LXQt修改开始菜单高亮

开始菜单红色高亮很难看 mkdir -p ~/.local/share/lxqt/palettes/ mkdir -p ~/.local/share/lxqt/themes/ cp /usr/share/lxqt/palettes/Dark ~/.local/share/lxqt/palettes/Darker cp -p /usr/share/lxqt/themes/dark ~/.local/share/lxqt/themes/darker lxqt-panel.qss L…

DeepSeek-R1-0528-Qwen3-8B 本地ollama离线运行使用和llamafactory lora微调

参考: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B 量化版本: https://huggingface.co/unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUF https://docs.unsloth.ai/basics/deepseek-r1-0528-how-to-run-locally 1、ollama运行 升级ollama版本到0.9.0 支持直接…

vue3 + WebSocket + Node 搭建前后端分离项目 开箱即用

[TOC](vue3 WebSocket Node 搭建前后端分离项目) 开箱即用 前言 top1&#xff1a;vue3.5搭建前端H5 top2&#xff1a;Node.js koa搭建后端服务接口 top3&#xff1a;WebSocket 长连接实现用户在线聊天 top4&#xff1a;接口实现模块化 Mysql 自定义 top5&#xff1a;文件上…

Vue 前端代码规范实战:ESLint v9、Prettier 与 Stylelint 集成指南与最佳实践

&#x1f680; 作者主页&#xff1a; 有来技术 &#x1f525; 开源项目&#xff1a; youlai-mall ︱vue3-element-admin︱youlai-boot︱vue-uniapp-template &#x1f33a; 仓库主页&#xff1a; GitCode︱ Gitee ︱ Github &#x1f496; 欢迎点赞 &#x1f44d; 收藏 ⭐评论 …

docker docker-ce docker.io

Ubuntu安装 ​​更新软件包列表​​ 首先确保软件包列表是最新的&#xff1a; sudo apt-get update 使用正确的卸载命令​​ 替换 docker-engine 为 docker-ce 或 docker.io&#xff1a; sudo apt-get remove docker docker-ce docker.io containerd runc ​​检查已安装的 Do…

C++ 初阶 | 类和对象易错知识点(下)

目录 0.引言 1.初始化列表 2.static 静态成员变量&#xff1a; 静态成员函数&#xff1a; 3.友元函数 4.内部类 定义&#xff1a; 特点&#xff1a; 应用&#xff1a; 5.优化写法 6.例题 求和12...n (不能用for/while/if/else等关键字) 7.总结 0.引言 今天&…

使用yocto搭建qemuarm64环境

环境 yocto下载 # 源码下载 git clone git://git.yoctoproject.org/poky git reset --hard b223b6d533a6d617134c1c5bec8ed31657dd1268 构建 # 编译镜像 export MACHINE"qemuarm64" . oe-init-build-env bitbake core-image-full-cmdline 运行 # 跑虚拟机 export …

AWS WebRTC:获取ICE服务地址(part 3):STUN服务和TURN服务的作用

STUN服务和TURN服务的作用&#xff1a; 服务全称作用是否中继流量适用场景STUNSession Traversal Utilities for NAT 协助设备发现自己的公网地址&#xff08;srflx candidate&#xff09; ❌ 不中继&#xff0c;仅辅助NAT 穿透成功时使用TURNTraversal Using Relays around N…

分析XSSstrike源码

#用于学习web安全自动化工具# 我能收获什么&#xff1f; 1.XSS漏洞检测机制 学习如何构造和发送XSS payload如何识别响应中的回显&#xff0c;WAF&#xff0c;过滤规则等如何使用词典&#xff0c;编码策略&#xff0c;上下文探测等绕过过滤器 2.Python安全工具开发技巧 使…

npm run build 报错:Some chunks are larger than 500 KB after minification

当我们的 Vue 项目太大&#xff0c;使用 npm run build 打包项目的时候&#xff0c;就有可能会遇到以下报错&#xff1a; (!) Some chunks are larger than 500 kB after minification. Consider: - Using dynamic import() to code-split the application - Use build.rollup…

【LLM相关知识点】关于LLM项目实施流程的简单整理(一)

【LLM相关知识点】关于LLM项目实施流程的简单整理&#xff08;一&#xff09; 文章目录 【LLM相关知识点】关于LLM项目实施流程的简单整理&#xff08;一&#xff09;零、学习计划梳理&#xff1a;结合ChatGPT从零开始学习LLM & 多模态大模型一、大模型相关应用场景和头部企…

海上石油钻井平台人员安全管控解决方案

一、行业挑战与需求分析 海上钻井平台面临复杂环境风险&#xff08;如易燃易爆、金属干扰、极端气象&#xff09;和人员管理难题&#xff08;如定位模糊、应急响应延迟&#xff09;。传统RFID或蓝牙定位技术存在精度不足&#xff08;1-5米&#xff09;、抗干扰能力差等问题&am…

@Docker Compose 部署 Pushgateway

文章目录 Docker Compose 部署 Pushgateway1. 目的2. 适用范围3. 先决条件4. 部署步骤4.1 创建项目目录4.2 创建 docker-compose.yml 文件4.3 启动 Pushgateway 服务4.4 验证服务运行状态4.5 测试 Pushgateway 访问 5. 配置 Prometheus 采集 Pushgateway 数据6. 日常维护6.1 查…

项目 react+taro 编写的微信 小程序,什么命令,可以减少console的显示

在 Taro 项目中&#xff0c;为了减少 console 的显示&#xff08;例如 console.log、console.info 等&#xff09;&#xff0c;可以通过配置 terser-webpack-plugin 来移除生产环境中的 console 调用。 配置步骤&#xff1a; 修改 index.js 文件 在 mini.webpackChain 中添加 …

Java开发中常见的数值处理陷阱与规避方法

八进制字面量的误用问题 历史背景与语法特性 由于历史原因,Java保留了八进制字面量的支持。八进制字面量以数字0开头,例如037表示十进制数31(计算方式:38 + 7 = 31)。这种表示法在现代编程中极少使用,唯一合理的应用场景是表示Unix文件权限(如0644表示用户可读写,组和…

Lua5.4.2常用API整理记录

一、基础函数 1.type(value)​​ 返回值的类型&#xff08;如 "nil", "number", "string", "table", "function" 等&#xff09;。 代码测试&#xff1a; a 0 print(type(a)) a nil print(type(a)) a "aaaaaaaa&…

2025.5.29 学习日记 docker概念以及基本指令

Docker&#xff1a; Docker 是一种开源的容器化平台&#xff0c;用于快速部署应用程序&#xff0c;实现开发、测试和生产环境的一致性。 一、Docker 核心概念 镜像&#xff08;Image&#xff09; 只读的模板文件&#xff0c;用于创建容器&#xff0c;类似虚拟机的镜像&#x…

明远智睿SSD2351开发板:语音机器人领域的变革力量

在人工智能快速发展的今天&#xff0c;语音机器人逐渐成为人们生活和工作中的得力助手。明远智睿SSD2351开发板凭借强大性能与丰富功能&#xff0c;为语音机器人的发展注入新动力&#xff0c;成为该领域的变革力量。 SSD2351开发板的四核1.4GHz处理器具备强劲的运算性能&#x…