llama_index chromadb实现RAG的简单应用

此demo是自己提的一个需求:用modelscope下载的本地大模型实现RAG应用。毕竟大模型本地化有利于微调,RAG使内容更有依据。

为什么要用RAG?

由于大模型存在一定的局限性:知识时效性不足、专业领域覆盖有限以及生成结果易出现“幻觉”问题,需要通过结合实时数据和专业知识提升生成内容的准确性、时效性和可信度。‌‌检索增强生成(RAG)的核心价值在于弥补大模型固有缺陷

一个简单样例

加载本地大语言模型和embedding模型,读取指定目录下的文档

import os
import chromadb
from modelscope import snapshot_download
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.core.node_parser import SimpleNodeParser
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.huggingface import HuggingFaceLLM
from llama_index.core.base.llms.types import ChatMessage
from llama_index.vector_stores.chroma import ChromaVectorStore
# llamaindex中文网站 https://www.aidoczh.com/llamaindex/module_guides/index.html
# https://docs.llamaindex.ai/en/stable/use_cases/
from dotenv import load_dotenv
load_dotenv(dotenv_path=".env")
cache_apath = os.path.join(os.getcwd(), 'cache')
os.environ["TRANSFORMERS_CACHE"] = cache_apath
os.environ["HF_HOME"] = cache_apath
os.environ["MODELSCOPE_CACHE"] = cache_apathllm_model_name = "Qwen/Qwen2.5-0.5B-Instruct" # "deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B" #
llm_model_path = os.path.join(cache_apath,*llm_model_name.replace(".","___").split('/'))
# llm_model_path = snapshot_download(llm_model_name, cache_dir=cache_apath) # 从modelscope下载大模型# 下载并指定sentence-transformers模型
sentence_transformers_name = 'sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2'
embedding_model_path = os.path.join(cache_apath,*sentence_transformers_name.replace(".","___").split('/'))
# embedding_model_path = snapshot_download(sentence_transformers_name, cache_dir=cache_apath) # 从modelscope下载大模型# 初始化HuggingFaceEmbedding对象,用于文本向量转换
embed_model = HuggingFaceEmbedding(model_name=embedding_model_path)
Settings.embed_model = embed_model# 加载本地HuggingFace大模型
llm = HuggingFaceLLM(model_name=llm_model_path,tokenizer_name=llm_model_path,model_kwargs={"trust_remote_code": True},tokenizer_kwargs={"trust_remote_code": True}
)
#‌设置全局LLM属性‌
Settings.llm = llmstore_vector2Chroma = True
#从指定目录读取文档,将数据加载到内存
documents=SimpleDirectoryReader(r"source\data1").load_data()

文档可以加载到内存 或者 向量数据库里(chroma或者FAISS等)

加载到内存然后检索的范例

#创建一个VectorStoreIndex,并使用之前加载的文档来构建向量索引#此索引将文档转换为向量,并存储这些向量(内存)以便于快速检索
index=VectorStoreIndex.from_documents(documents)# 创建一个查询引擎,这个引擎可以接收查询并返回相关文档的响应。
query_engine =index.as_query_engine()
rsp = query_engine.query("文章里相关的问题写在这里")
print(rsp)

加载到chroma的范例

# 定义向量存储数据库
chroma_client = chromadb.PersistentClient()
chroma_collection = chroma_client.get_or_create_collection("data1vector")
vector_store = ChromaVectorStore(chroma_collection=chroma_collection)
# 创建节点解析器
node_parser = SimpleNodeParser.from_defaults(chunk_size=512, chunk_overlap=100)
# 将文档分割成节点
base_node = node_parser.get_nodes_from_documents(documents=documents)
# print(base_node)
index = VectorStoreIndex(nodes=base_node)
# index = VectorStoreIndex.from_documents(documents=documents) # 可以替代上面3句
# 将索引持久化到本地的向量数据库
index.storage_context.persist()
# 创建一个查询引擎,这个引擎可以接收查询并返回相关文档的响应。
query_engine =index.as_query_engine()
rsp = query_engine.query("文章里相关的问题写在这里")
print(rsp)

chroma官网提供的API不是很多,但是llama_index、langchain等进行封装,封装得很好

文档尽量按照功能分为不同的小文件,生成的向量json文件有对应每部分metadata的描述,如此query的结果可以找到对应文章的哪几部分,内容是什么

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/85871.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/85871.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TDMQ CKafka 版事务:分布式环境下的消息一致性保障

解锁 CKafka 事务能力的神秘面纱 在当今数字化浪潮下,分布式系统已成为支撑海量数据处理和高并发业务的中流砥柱。但在这看似坚不可摧的架构背后,数据一致性问题却如影随形,时刻考验着系统的稳定性与可靠性。 CKafka 作为分布式流处理平台的…

常见的负载均衡算法

常见的负载均衡算法 在实现水平扩展过程中,负载均衡算法是决定请求如何在多个服务实例间分配的核心逻辑。一个合理的负载均衡策略能够有效分散系统压力,提升系统吞吐能力与稳定性。 负载均衡算法可部署在多种层级中,如七层HTTP反向代理&…

数据结构转换与离散点生成

在 C 开发中&#xff0c;我们常常需要在不同的数据结构之间进行转换&#xff0c;以满足特定库或框架的要求。本文将探讨如何将 std::vector<gp_Pnt> 转换为 QVector<QPointF>&#xff0c;并生成特定范围内的二维离散点。 生成二维离散点 我们首先需要生成一系列…

零基础学习Redis(12) -- Java连接redis服务器

在我们之前的内容中&#xff0c;我们会发现通过命令行操作redis是十分不科学的&#xff0c;所以redis官方提供了redis的应用层协议RESP&#xff0c;更具这个协议可以实现一个和redis服务器通信的客户端程序&#xff0c;来简化和完善redis的使用。现阶段有很多封装了RESP协议的库…

clangd LSP 不能找到项目中的文件

clangd LSP 不能找到项目中的文件 clangd LSP 不能找到项目中的文件 clangd LSP 不能找到项目中的文件 Normally you need to create compile_commands.json。 如果你使用 cmake 作为构建工具&#xff0c;请执行下面的命令&#xff1a; cmake -DCMAKE_EXPORT_COMPILE_COMMAN…

【内存】Linux 内核优化实战 - vm.overcommit_memory

目录 vm.overcommit_memory 解释一、概念与作用二、参数取值与含义三、相关参数与配置方式四、实际应用场景建议五、注意事项 vm.overcommit_memory 解释 一、概念与作用 vm.overcommit_memory 是 Linux 内核中的一个参数&#xff0c;用于控制内存分配的“过度承诺”&#xf…

Python:.py文件转换为双击可执行的Windows程序(版本2)

流程步骤&#xff1a; 这个流程图展示了将 Python .py 文件转换为 Windows 可执行程序的完整过程&#xff0c;主要包括以下步骤&#xff1a; 1、准备 Python文件&#xff0c;确保代码可独立运行 2、安装打包工具&#xff08;如 PyInstaller&#xff09; 3、打开命令提示符并定位…

【请关注】mysql一些经常用到的高级SQL

经常去重复数据&#xff0c;数据需要转等操作&#xff0c;汇总高级SQL MySQL操作 一、数据去重&#xff08;Data Deduplication&#xff09; 去重常用于清除重复记录&#xff0c;保留唯一数据。 1. 使用DISTINCT关键字去重单列 -- 从用户表中获取唯一的邮箱地址 SELECT DISTIN…

RA4M2开发涂鸦模块CBU(2)----配置按键开启LED

RA4M2开发涂鸦模块CBU.2--配置按键开启LED 概述视频教学样品申请硬件准备参考程序按键口配置中断回调函数主程序 概述 本实验演示如何在 Renesas RA4M2 单片机上使用 GPIO 输入&#xff08;按键&#xff09; 触发 GPIO 输出&#xff08;LED&#xff09;&#xff0c;并使用e2st…

Linux——Json

一 概念 json是一种轻量级&#xff0c;基于文本的&#xff0c;可读的数据交换格式&#xff0c;能够让数据在不同系统&#xff08;比如前端—后端&#xff0c;服务器—客户端&#xff09;间方便传递/存储。在编程语言中都内置了处理json数据的方法 二 语法规则 1. 数据格式&a…

大模型之微调篇——指令微调数据集准备

写在前面 高质量数据的准备是微调大模型的重中之重&#xff0c;一些高质量的数据集可能远比模型性能更佳重要。 我是根据自己的数据照着B站up code花园LLaMA Factory 微调教程&#xff1a;如何构建高质量数据集&#xff1f;_哔哩哔哩_bilibili做的。 数据集格式 在LLaMA Fa…

LVS—DR模式

LVS—DR模式 LVS DR 模式详细简介 一、模式定义与核心原理 LVS DR&#xff08;Direct Routing&#xff09;模式&#xff0c;即直接路由模式&#xff0c;是 Linux Virtual Server&#xff08;LVS&#xff09;实现负载均衡的经典模式之一&#xff0c;工作于网络四层&#xff0…

宝玉分享VibeCoding构建Agent

借助 Claude Code 完成的一个翻译智能体 (Translator Agent)。你只需输入一段文字、一个网址或一个本地文件路径&#xff0c;它就能自动提取内容并完成翻译。更酷的是&#xff0c;它还能修正原文中的拼写错误&#xff0c;确保译文的准确流畅。 到底什么是“真正的”AI Agent&a…

在spring boot中使用Logback

在 Spring Boot 中使用 Logback 作为日志框架是开发中的常见需求&#xff0c;因其高性能和灵活配置而广受青睐。以下是详细实践指南&#xff0c;结合了配置方法、代码示例及最佳实践&#xff1a; &#x1f527; 一、依赖配置 Spring Boot 默认集成了 Logback&#xff0c;无需手…

腾讯云 Lighthouse 轻量应用服务器:数据驱动的架构选型指南

摘要&#xff1a;腾讯云 Lighthouse 作为面向轻量级应用场景的优化解决方案&#xff0c;通过高性价比套餐式售卖、开箱即用应用模板及流量包计费模式&#xff0c;显著降低中小企业与开发者的上云门槛。本文基于性能测试与横向对比&#xff0c;量化分析其核心优势与适用边界。 …

Linux TCP/IP协议栈中的TCP输入处理:net/ipv4/tcp_input.c解析

在网络通信领域,TCP(传输控制协议)因其可靠的面向连接特性而被广泛应用。Linux内核的TCP/IP协议栈实现了对TCP协议的高效处理,其中net/ipv4/tcp_input.c文件扮演着关键角色,负责处理TCP数据包的输入逻辑。下面是对该文件核心功能的深入剖析。 一、TCP数据包接收与处理 (…

物联网传输网关、RTU、DTU及SCADA系统技术解析

目录 摘要 一、引言 二、物联网传输网关 1. 定义 2. 类型 3. 分类 4. 工作原理 5. 差异分析 总结&#xff1a; 三、RTU&#xff08;远程终端单元&#xff09; 1. 定义 2. 工作原理 3. 特点 4. 应用场景 四、DTU&#xff08;数据传输单元&#xff09; 1. 定义 …

【unity游戏开发——热更新】YooAsset简化资源加载、打包、更新等流程

注意&#xff1a;考虑到热更新的内容比较多&#xff0c;我将热更新的内容分开&#xff0c;并全部整合放在【unity游戏开发——热更新】专栏里&#xff0c;感兴趣的小伙伴可以前往逐一查看学习。 文章目录 前言1、什么是YooAsset&#xff1f;2、系统需求3、系统特点 一、下载安装…

AWS RDS/Aurora 开启 Database Insights 高级模式全攻略

想要深入了解数据库性能问题?AWS Database Insights 高级模式为您提供强大的性能分析工具。本文详细对比标准模式与高级模式的功能差异,并提供完整的启用指南和实战测试结果。 一、Database Insights 模式对比 AWS CloudWatch Database Insights 提供两种模式:标准模式和高…

XML SimpleXML

XML SimpleXML 引言 XML&#xff08;可扩展标记语言&#xff09;是一种用于存储和传输数据的标记语言&#xff0c;它被广泛应用于Web服务和数据交换。SimpleXML是PHP中一个处理XML数据非常便捷的库。本文将详细介绍SimpleXML库的基本用法&#xff0c;帮助读者快速掌握XML数据…