再见 RAG?Gemini 2.0 Flash 刚刚 “杀死” 了它!

最近谷歌发布了 Gemini 2.0 Flash,说实话,它可能是目前市面上性价比最高的 AI 模型了。

许多人写过关于 RAG 可能不再需要的文章,也可以看到人们在讨论它。有些人理解,有些人不理解,还有些人非常担心。

所以让我们解释一下:

RAG 到底是什么?

为什么它可能不再像我们过去认为的那样必要?

如果你正在构建 AI 相关的东西 —— 或者只是好奇 —— 为什么你应该关心它?

RAG 到底是什么?

如果你是 AI 领域的新手,那么请记住,RAG 代表检索增强生成(Retrieval-Augmented Generation)。它一直是一种常用技术,用于帮助 ChatGPT 等 AI 模型访问其原始训练数据中没有的外部信息。

你可能在不知不觉中见过它的实际应用。

用过 Perplexity 或必应的 AI 搜索吗?当它们在回答你的问题时进行搜索,这就是 RAG 在起作用。甚至当你将文件上传到 ChatGPT 并询问相关问题时 —— 这也是 RAG。

RAG 如此重要的原因是,AI 模型过去的记忆窗口非常小。回到 2023 年初,当时模型只能处理约4000 个 token(相当于 6 页文本)。这意味着如果你有大量信息,而 AI 无法 “记住” 所有内容 —— 你必须将其分解,以特殊方式存储(嵌入、向量数据库、分块等),然后在需要时检索正确的部分。

但现在?忘了吧。

这是传统 RAG 的处理流程:

Gemini 2.0 Flash(RAG杀手?)

是的,你没听错!如今所有AI模型都能一次性处理海量信息。

但Gemini 2.0呢? 它能处理高达100万token。有些模型甚至达到了200万

这意味着你不再需要将数据切成小块并研究如何检索——现在可以直接将完整数据导入模型,让它一次性对所有内容进行推理。

最关键的是——这些新模型不仅记忆容量更大,还精准得多。谷歌的最新模型拥有我们见过的最低幻觉率(即“编造内容”的概率)。 仅凭这一点就带来了巨大改变。

Gemini 2.0直接文档处理

为什么这会颠覆一切?

举个真实场景的例子:

假设你有一份财报电话会议记录——长达5万token(非常庞大)。 如果使用传统RAG,你必须将其拆分成512-token的小块并存储。 当有人提问时,你需要抓取最相关的片段并输入AI。

问题在于:你无法对整个文档进行全局推理。

试想这样一个问题:

“这家公司的营收与去年相比如何?”

如果只抓取小片段,你可能无法获得完整信息。但如果将整个文档记录输入Gemini 2.0呢?它能通览所有内容——从CEO的开场白到中间的财务数据,再到他们回答分析师问题的内容——并给出更优质、更周全的答案。

所以当我们说“RAG已死”时,意思是:

传统RAG处理方式(将单个文档拆分成块)已经过时了。

你不再需要它。只需将所有内容喂给大模型,让它施展魔法即可。

不过,RAG 并未完全消亡

现在,有人会问:

“如果我有10万份文档呢?”

这个问题很合理!

如果你在处理海量数据集(比如苹果过去十年的所有财报),仍然需要一种筛选方法。但即便如此,处理方式也不同了:

  1. 先搜索相关文档(例如只提取2020-2024年的苹果财报会议记录)。

  2. 将完整文档并行分别输入AI模型。

  3. 合并响应并生成最终答案。

这种方法比传统分块法精准得多——它让AI能够真正基于完整文档进行思考,而不是被迫处理碎片化片段。

下图展示了处理大型文档集的现代方法流程图:

核心结论

如果你在构建AI产品或进行实验,记住要保持简单,很多人会在没必要时把事情复杂化。只需将完整文档上传到Gemini 2.0(或任何大上下文AI模型),让它处理推理即可。

一年后情况会变吗?很可能。AI模型正变得更便宜、更智能、更快。但就目前而言,传统RAG方法已成为过去式。把数据扔进谷歌的新模型,用更少的麻烦获得更好的结果。如果你有文档需要分析,不妨试试——可能会惊讶于一切变得如此简单。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/87390.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/87390.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PDF的图片文字识别工具

PDF的图片文字识别工具是一款完全免费的PDF OCR识别软件,软件支持“单文件选择、多文件批量选择、文字预处理、结果后处理、Word导出”等功能。 选择你想要识别的PDF,软件就自动的开始识别PDF内容,识别后的文字在软件的下方有内容预览。 注意…

SQLite不够用?视频汇聚系统EasyCVR切换MySQL数据库的关键参数怎么调?

一、为什么需要将EasyCVR从SQLite切换到MySQL? EasyCVR默认使用的SQLite数据库属于轻量级嵌入式数据库,适合小型项目或设备量较少的场景(通常建议设备通道数≤200)。当设备通道数超过200或需要支持高并发访问、海量数据存储时&am…

【AI成长会】ubuntu 安装运行rust

在Ubuntu上用Rust编写第一个程序 从你的输出可以看出,Rust已经成功安装在你的Ubuntu系统上了。现在我们来编写并运行第一个Rust程序,整个过程需要几个简单的步骤: 一、配置Shell环境(如果需要) 虽然安装提示可能需要…

两个手机都用同个wifi,IP地址会一样吗?如何更改ip地址

会的。两个手机连接同一个 WiFi 路由器,它们的 IP 地址通常一样的。 一、原因如下: 你看到的 IP 地址有两种: 内网 IP 地址(局域网 IP): 这是路由器分配给你手机在家庭或办公室内部网络使用的地址。通常格…

十六、windows系统安全-----账号克隆和隐藏

环境 windows server 2012 步骤 1.查看当前用户账号cmd 命令net user,或在计算机管理界面查看 2.查看具体用户信息 net user 用户名 3.新建隐藏用户 net user shiyan$ qwe123 /add **4.添加用户组 net localgroup administrators shiyan$ /add**将刚才创建的隐藏…

【安全有效新方案】WSL 默认路径迁移实战:通过 PowerShell 符号链接实现自动重定向

WSL 默认路径迁移实战&#xff1a;通过 PowerShell 符号链接实现自动重定向 在使用 WSL&#xff08;Windows Subsystem for Linux&#xff09;的过程中&#xff0c;许多用户会遇到 C 盘空间被 WSL 发行版不断占用的问题。这是因为 WSL 默认将发行版存储在C:\Users\<用户名&…

使用DDR4控制器实现多通道数据读写(十八)

一、 概述 在之前已经使用interconnect IP 实现了DDR4的多通道读写功能&#xff0c;接下来为了更能接近实用性和更直观的展现多通道读写的功能&#xff0c;使用DDS IP 核生成两组正弦波信号&#xff0c;将两组正弦波信号通过其中两个通道存储到DDR4中&#xff0c;再使用另外两个…

基于Vue.js + Node.js + MySQL实现的图书销售管理系统

图书销售管理系统 项目概述 图书销售管理系统是一个基于Vue.js Node.js MySQL的全栈Web应用程序&#xff0c;专为数据库课程设计而开发。该系统实现了完整的图书销售业务流程管理&#xff0c;包括图书信息管理、库存管理、采购管理、销售管理和统计分析等功能模块。 项目背…

工业路由器赋能智慧电力储能柜实时通讯,构建电力智能化新生态

在电力行业迈向智能化的进程中&#xff0c;智慧电力储能柜作为实现电力灵活调配与高效存储的关键设施&#xff0c;其重要性日益凸显。然而复杂多变的应用环境、多样的设备接入需求、严苛的数据传输要求以及严峻的网络安全威胁&#xff0c;给储能柜的实时通讯带来诸多挑战。工业…

命令模式 - Flutter中的操作封装大师,把“动作“变成可管理的对象!

痛点场景&#xff1a;绘图应用的操作管理 假设你在开发一个绘图App&#xff0c;需要支持&#xff1a; 添加/删除图形修改图形属性撤销/重做操作批量执行命令 传统实现方式&#xff1a; void _handleAddShape(ShapeType type) {final shape _createShape(type);setState(()…

AI大模型应用开发完整学习体系

&#x1f3af; AI大模型应用开发完整学习体系 第一部分&#xff1a;课程核心内容 本课程系统化构建AI大模型应用开发能力体系&#xff0c;涵盖五大核心模块&#xff1a; 1️⃣ AI大模型开发基础 深入理解大模型架构&#xff08;如DeepSeek&#xff09;、Prompt工程优化、Cu…

UG NX二次开发(C#)-读取PMI对象的名称

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1、前言2、在UG NX中设置PMI对象名称3、采用NXOpen获取PMI对象名称1、前言 PMI对象是UG NX的一个很重要的对象,其获取主要是通过NXOpen来实现,在QQ群有群友问下如何获取PMI的对象名称,我们这篇…

大数据时代UI前端的智能决策支持:基于数据驱动的产品优化

hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩! 一、引言&#xff1a;数据驱动决策的前端智能化变革 在数字化转型的浪潮中&#xff0c;UI 前…

服务器性能调优实战:如何在高负载下维持系统稳定性?

更多云服务器知识&#xff0c;尽在hostol.com 当服务器遭遇高负载时&#xff0c;它就像一个拼命运转的发动机&#xff0c;任何小小的波动都可能导致系统崩溃。你也许会看到 CPU 突然飙升、内存紧张、响应延迟增加&#xff0c;甚至进程挂掉。而这一切往往发生得悄无声息&#x…

CSS `@scope` 实战指南:开启局部样式隔离新时代

&#x1f9ec; CSS scope 实战指南&#xff1a;开启局部样式隔离新时代 你是否曾担心组件样式被全局覆盖&#xff1f;是否为命名空间冲突而头痛&#xff1f;CSS scope 是原生支持的作用域样式机制&#xff0c;让你不再依赖 BEM、CSS Modules、Scoped CSS 等方案&#xff0c;也能…

spring-ai-alibaba 1.0.0.2 学习(六)——DocumentReader与DocumentParser

spring-ai-alibaba提供了许多读取外部文档的包&#xff0c;例如语雀、飞书、notion笔记等 这些包以spring-ai-alibaba-starter-document-reader开头&#xff0c;实现了spring-ai的DocumentReader接口 最简单样例 我们一起来看一个最简单的例子&#xff0c;以spring-ai-aliba…

在银河麒麟V10 SP1上手动安装与配置高版本Docker的完整指南

原文链接&#xff1a;在银河麒麟V10 SP1上手动安装与配置高版本Docker的完整指南 Hello&#xff0c;大家好啊&#xff0c;今天给大家带来一篇银河麒麟桌面操作系统&#xff08;Kylin V10 SP1&#xff09;上安装与配置Docker的文章&#xff0c;详细介绍从下载安装到运行容器的每…

如何在电脑上完全抹去历史记录

要在电脑上‌完全抹去历史记录‌&#xff08;包括浏览记录、文件痕迹、系统日志等&#xff09;&#xff0c;需根据需求选择不同级别的清理方案。以下是分步骤的彻底清理指南&#xff1a; ‌一、基础清理&#xff1a;删除常见痕迹‌ ‌1. 浏览器记录清除‌ ‌Chrome/Firefox/E…

大数据环境搭建指南:基于 Docker 构建 Hadoop、Hive、HBase 等服务

大数据环境搭建指南&#xff1a;基于 Docker 构建 Hadoop、Hive、HBase 等服务 说明大数据环境搭建指南&#xff1a;基于 Docker 构建 Hadoop、Hive、HBase 等服务一、引言二、项目概述三、搭建步骤3.1 下载文件3.2 构建镜像3.2.1 构建基础层镜像3.2.2 并行构建 HBase/Hive/Spa…

AWS WebRTC:根据viewer端拉流日志推算视频帧率和音频帧率

viewer端拉流日志是这样的&#xff1a; 07:19:26.263 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 140092278368896, Size: 160, Flags 3210729368 2025-06-12 07:19:26.283 VERBOSE sampleAudioFrameHandler(): Audio Frame received. TrackId: 14009…