【Ragflow】27.RagflowPlus(v0.4.1):小版本迭代,问题修复与功能优化

概述

RagflowPlus v0.4.0 在发布后,收到了积极的反馈,同时也包含一些问题。

本次进行一轮小版本更新,发布 v0.4.1 版本,对已知问题进行修复,并对部分功能进行进一步优化。

开源地址:https://github.com/zstar1003/ragflow-plus

更新方法

下载仓库最新代码:

git clone https://github.com/zstar1003/ragflow-plus.git

使用docker启动:

# cpu模式
docker compose -f docker/docker-compose.yml up -d
# gpu模式
docker compose -f docker/docker-compose_gpu.yml up -d

首次启动会自动拉取最新版本镜像。

问题修复

1.修复解析excel文件时,依赖缺失的问题(issue#149)

2.修复解析pdf文件时,遇到空内容表格,出现异常的问题。

功能优化

1. 图像显示路径优化

之前的版本中,将图像的存储路径硬编码为es属性中,导致在局域网环境下访问时,容易出现图片不显示的情况。

v0.4.0版本中,易出现此问题

在本版本中,对每张图片的协议、ip地址和在minio中的相对路径进行解耦

在es中,只存储图片的相对路径地址,具体的访问ip地址可通过docker/.env中的MINIO_VISIT_HOST变量进行控制。

es中解析块属性可视化

通过这样的修改,可使问答时,图像稳定显示。

2. 容器连接通路优化

由于对minio的访问地址进行解耦,在后台管理中进一步修改连接配置database.py文件:

if is_running_in_docker():MYSQL_HOST = "mysql"MYSQL_PORT = 3306MINIO_HOST = "minio"MINIO_PORT = 9000ES_HOST = "es01"ES_PORT = 9200REDIS_HOST = "redis"REDIS_PORT = 6379

在docker环境中,直接通过服务名进行访问,而不再像之前的版本那样通过宿主机再间接访问。

之前版本访问路径(蓝色线条)现版本访问路径(红色箭头)

这样修改,有效避免了用户在上传文件时,容易出现超时未响应的情况,连接速度更快更稳定。

3. 图片插入位置优化

在之前的版本中,所有相关图像会在问答末尾一并输出。

本次对图像输出进行了改良,现在图像会出现在第一个相关块的引用位置,可在问答中间输出。

如有引用标记,该引用块有关联图像,则将其显示在下方

4. 增加文档撰写模式的缓存

在文档撰写模块中,新增了当前编辑文档内容的自动保存功能。

通过浏览器自带的Local storage,实现对每间隔1s对内容进行无感保存。

切换标签或刷新页面后,之前编辑的内容依然存在,不会消失。

刷新界面,文档界面依然存在

5. word导出支持自动图片下载插入

在文档撰写模块中,导出word文件时,会自动下载编辑区的图像块连接,实现图片的自动下载插入。

导出word效果

6. Top N上限增加

在聊天配置中,有一个Top N的选项,用来控制大模型能实际看到的前N个解析块数量。

原始默认的Top N上限为30,因为在每个块内容较多的情况下,如果塞入大模型的参考内容过多,会超过模型的最大输入上限。

考虑到部分用户应用的内容查询业务,每个块的内容很少,查询数量很多,因此增加Top N的上限为100,默认保持8不变。

当前版本可上调

问题反馈须知

当前的每轮版本更新都修改文件解析的逻辑,因此,读者在试用反馈问题时,建议新建知识库进行解析。

在后台管理系统中,新建知识库

通过知识库隔离,可防止不同版本的解析文件混杂在相同知识库中,造成异常情况。

总结

此次更新后,在局域网服务器中进行了一轮测试,目前已基本能满足个人应用场景的使用需求。

后续会将精力投入到大模型相关的基建拓展研究中,比如,embedding模型的效果如何评估,如何微调大模型。

之前定下的Ragflow-Plus的更新计划将会暂缓推进,如果有开发经验的读者想继续对此项目进行贡献,欢迎提交PR。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/908666.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【hadoop】Flink安装部署

一、单机模式 步骤: 1、使用XFTP将Flink安装包flink-1.13.5-bin-scala_2.11.tgz发送到master机器的主目录。 2、解压安装包: tar -zxvf ~/flink-1.13.5-bin-scala_2.11.tgz 3、修改文件夹的名字,将其改为flume,或者创建软连接…

Linux 下 ChromeDriver 安装

个人博客地址:Linux 下 ChromeDriver 安装 | 一张假钞的真实世界 Selenium 是一个用于 Web 应用程序测试的工具。可以通过它驱动浏览器执行特定的操作,如点击、下滑、资源加载与渲染等。该工具在爬虫开发中也非常有帮助。Selenium 需要通过浏览器驱动操…

Canal环境搭建并实现和ES数据同步

作者:田超凡 日期:2025年6月7日 Canal安装,启动端口11111、8082: 安装canal-deployer服务端: https://github.com/alibaba/canal/releases/1.1.7/canal.deployer-1.1.7.tar.gz cd /opt/homebrew/etc mkdir canal…

STM32使用土壤湿度传感器

1.1 介绍: 土壤湿度传感器是一种传感装置,主要用于检测土壤湿度的大小,并广泛应用于汽车自动刮水系统、智能灯光系统和智能天窗系统等。传感器采用优质FR-04双料,大面积5.0 * 4.0厘米,镀镍处理面。 它具有抗氧化&…

锁的艺术:深入浅出讲解乐观锁与悲观锁

在多线程和分布式系统中,数据一致性是一个核心问题。锁机制作为解决并发冲突的重要手段,被广泛应用于各种场景。乐观锁和悲观锁是两种常见的锁策略,它们在设计理念、实现方式和适用场景上各有特点。本文将深入探讨乐观锁和悲观锁的原理、实现…

Jinja2深度解析与应用指南

1. 概念与用途 1.1 核心概念 Jinja2是Python生态中功能强大的模板引擎,采用逻辑与表现分离的设计思想: 模板:包含静态内容和动态占位符的文本文件(.j2后缀)渲染:将模板与数据结合生成最终文本的过程上下…

Ubuntu20.04中 Redis 的安装和配置

Ubuntu20.04 中 Redis 的安装和配置 Ubuntu 安装 MySQL 及其配置 1. Redis 的安装 更新系统包列表并安装 Redis : # 更新包管理工具 sudo apt update# -y:自动确认所有提示(非交互式安装) sudo apt install -y redis-server测…

Sklearn 机器学习 缺失值处理 填充数据列的缺失值

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】 【测试经验】 【人工智能】 【Python】 💡使用 Scikit-learn 处理数据缺失值的完整指南 在机器学习项目中,数据缺失是不可避…

Unity中如何播放视频

1.创建一个原始图像并调整布局平铺整个画布 2.创建自定义纹理并调整自定义纹理大小 3.添加视频播放组件 4.将准备好的视频素材拖入到视频剪辑中 5.将自定义纹理拖入到目标纹理中 6.将自定义纹理拖入到原始图像的纹理中 最后运行游戏,即可播放视频 总结:

Spring通用类型转换的实现原理

Spring通用类型转换的实现原理 设计思路实现逻辑ConversionService&#xff1a;类型转换服务入口ConverterRegister&#xff1a;转换器注册接口GenericConversionService1. Map<ConvertiblePair, GenericConverter> converters2. canConvert() 与 convert()&#xff1a;服…

红黑树完全指南:为何工程都用它?原理、实现、场景、误区全解析

红黑树完全指南&#xff1a;为何工程都用它&#xff1f;原理、实现、场景、误区全解析 作者&#xff1a;星之辰 标签&#xff1a;#红黑树 #平衡二叉查找树 #工程实践 #数据结构 #面试宝典 引子&#xff1a;工程师的“性能焦虑”与树的进化史 你以为树只是算法题里的配角&#…

阿里云 RDS mysql 5.7 怎么 添加白名单 并链接数据库

阿里云 RDS mysql 5.7 怎么 添加白名单 并链接数据库 最近帮朋友 完成一些运维工作 &#xff0c;这里记录一下。 文章目录 阿里云 RDS mysql 5.7 怎么 添加白名单 并链接数据库最近帮朋友 完成一些运维工作 &#xff0c;这里记录一下。 阿里云 RDS MySQL 5.7 添加白名单1. 登录…

Psychopy音频的使用

Psychopy音频的使用 本文主要解决以下问题&#xff1a; 指定音频引擎与设备&#xff1b;播放音频文件 本文所使用的环境&#xff1a; Python3.10 numpy2.2.6 psychopy2025.1.1 psychtoolbox3.0.19.14 一、音频配置 Psychopy文档链接为Sound - for audio playback — Psy…

分布式互斥算法

1. 概述&#xff1a;什么是分布式互斥 假设有两个小孩想玩同一个玩具&#xff08;临界资源&#xff09;&#xff0c;但玩具只有一个&#xff0c;必须保证一次只有一个人能够玩。当一个小孩在玩时&#xff0c;另一个小孩只能原地等待&#xff0c;直到玩完才能轮到自己。这就是 …

[创业之路-410]:经济学 - 国富论的核心思想和观点,以及对创业者的启发

一、国富论的核心思想和观点 《国富论》全称为《国民财富的性质和原因的研究》&#xff0c;由英国经济学家亚当斯密于1776年出版&#xff0c;是经济学领域的经典之作&#xff0c;其核心思想和观点对现代经济学的发展产生了深远影响&#xff0c;具体如下&#xff1a; 劳动价值…

Tavily 技术详解:为大模型提供实时搜索增强的利器

目录 &#x1f680; Tavily 技术详解&#xff1a;为大模型提供实时搜索增强的利器 &#x1f9e9; 为什么需要 Tavily&#xff1f; &#x1f50d; Tavily 是什么&#xff1f; 核心特性&#xff1a; &#x1f4e6; Tavily 在 RAG 架构中的位置 &#x1f9ea; 示例&#xff…

欣佰特科技亮相2025张江具身智能开发者大会:呈现人形机器人全链条解决方案

5月29日 &#xff0c;2025年张江具身智能开发者大会在上海落下帷幕。欣佰特科技作为专注人形机器人与具身智能领域的创新企业&#xff0c;携一系列前沿产品与解决方案参展&#xff0c;与全球行业专家、企业共同探讨技术落地路径&#xff0c;展现其在具身智能领域的技术积累与场…

@Prometheus 监控-MySQL (Mysqld Exporter)

文章目录 **Prometheus 监控 MySQL ****1. 目标****2. 环境准备****2.1 所需组件****2.2 权限要求** **3. 部署 mysqld_exporter****3.1 下载与安装****3.2 创建配置文件****3.3 创建 Systemd 服务****3.4 验证 Exporter** **4. 配置 Prometheus****4.1 添加 Job 到 prometheus…

MCP Resource模块详解

MCP Resource模块详解 摘要 MCP Resource模块是模型上下文协议的核心组件&#xff0c;通过标准化URI接口为AI模型提供安全可控的只读数据访问能力。其核心设计包括数据隔离架构和客户端驱动的访问控制&#xff0c;支持文本/二进制编码格式&#xff0c;适用于配置文件读取、数据…

Docker 容器化基础:镜像、容器与仓库的本质解析

Docker 概念与容器化技术 Docker 是一种容器化平台&#xff0c;能够将应用程序及其依赖项打包成一个容器&#xff0c;确保在任何环境中都能一致运行。容器化技术通过操作系统级别的虚拟化&#xff0c;为应用程序提供了一个独立的运行环境。 容器化技术的核心优势 一致性&…